您好,欢迎来到标准下载网!

博士级AI?马斯克xAI 推出Grok 4 多代理推理、预测市场功能一次看

时间:2025-07-11 12:00:06 来源:标准下载网 类别:软件攻略

马斯克领军的人工智慧公司xAI 几个小时前正式发表最新一代AI 模型Grok 4,号称为「地表最聪明AI」。该模型结合前所未有的推理能力、博士级学术水准与多工具使用的整合,并在多项基准测试中打破纪录。他预期Grok 4 将在一年内带来实质性的技术发明或学术意义。

Introducing Grok 4, the world's most powerful AI model. Watch the livestream now: https://t.co/59iDX5s2ck

— xAI (@xai) July 10, 2025

两版本:Grok 4 与Grok 4 Heavy

首先,Grok 4 分为单纯的单代理版本(Single-Agent Version) 的Grok 4、以及多代理版本(Multi-Agent Version) 的Grok 4 Heavy。

Grok 4 Heavy:采用多代理协作模式(multi-agent collaboration),让多个代理先各自解决问题,再如同「学习小组」般互相分享解决方案并比较彼此成果,再得出最终答案。

目前,该公司也推出了至今最昂贵的订阅计划「SuperGrok Heavy」,每月300 美元。计画订阅者能抢先体验Grok 4 Heavy 服务,以及未来所推出功能的优先使用权。

博士等级智慧:从SAT 满分到全领域天才

再来,xAI 声称Grok 4 具有超越人类的学术与逻辑能力,成为现阶段最接近通用人工智慧(AGI) 的模型之一。他能在美国SAT、GRE等高等考试中获得近乎满分的成绩,并在所有学科表现出博士以上等级的知识涵养。

另外,Grok 4 在多项指标性基准测试中创下新高,展现前所未见的能力边界。具体包括:

在Vending-Bench 自动贩卖机商业营运模拟测试中,成功让资产收入翻倍,展现出稳定且贯彻始终的策略制定能力。

生物医学研究中心ARC Institute 以Grok 4 协助自动化其研究流程,高效率推动实验进行。

其他还有医疗影像检查、金融策略制定与游戏开发等领域皆已存在实际应用。

同时,在人类终极测验(Humanity's Last Exam, HLE) 中,Grok 4 能在无辅助情况下解出25.4% 题目,Grok 4 Heavy 版本则能够解出44.4% 的题目,在现有AI 模型中排名第一。

用Colossus 超级电脑训练Grok 4,运算效率大提升

xAI 透露,Grok 4 的问世背后,是来自硬体与训练策略的双重飞跃:「Grok 4 的训练量是Grok 2 的100 倍。」

藉由我们的Colossus 超级电脑约20 万颗H100 GPU,从预训练到强化学习(RLHF),Grok 4 强化了模型对推理任务的专注与精确度。

团队强调,随着人类编写的考题难度已「无法有效训练」Grok 4,现实世界将成为最终的测试场所,像是能否真正创造有用的发明或技术,借以判断它们是否实际有效

工具整合与现实互动:Grok 4 迈向可操作性AI

同时,Grok 4 也不只是会思考,更将学会如何动手解决真实世界问题。 xAI 表明,不同于其他模型,Grok 4 将工具使用能力纳入训练流程,提升实作与应变能力:

未来几个月内,Grok 4 将接入特斯拉和SpaceX 使用的工程分析工具,进入更精密的工程环境。我们更计划在今年底前向各大公司提供强大的企业级工具与高度精确的物理模拟器。

团队补充,「当前目标是让Grok 能操纵人形机器人Optimus,并在物理世界中验证其逻辑与创意的真实与有效性。」

(辉达黄仁勋:华为晶片已追上NVIDIA H20,马斯克Optimus 机器人开启兆元商机)

超越人类的推理能力:Grok 4 能创造新发明?

再来是xAI 最引以为傲的推理功能,Grok 4 不仅能从训练资料中提取知识,更具备经强化训练所培养的的逻辑思考能力,能在未知情境中自行构建问题解法,并进行多代理的集体思辨验证,最终跟人类科学家一样推导出自己的结论:

Grok 4 被设计为从「第一性原理」出发的思考方式,能自行发现问题、建构逻辑并完成复杂的演绎,这是其他与以往AI 难以触及的推理场域。

xAI 预期,Grok 4 将在最早今年前、最晚明年发明出真正实用的新技术,并于未来两年内可能发现目前人类还未知的科学原理。

(专访马斯克:AI 超级智慧将爆发、创业者应追求「有用」而非「伟大」的人生)

从市场预测到游戏创作:Grok 4 应用层面再次扩大

最后,xAI 也展示了Grok 4 横跨语音互动与金融商业等多领域的实际应用潜力。以事件趋势判读为例,Grok 4 Heavy 能够查看预测市场Polymarket、运用统计计算与推理能力,仅用几分钟便预测出道奇队在世界大赛的胜率为21.6%,展现出超越传统量化分析工具的即时运算实力。

(X 宣布与Polymarket 合作,作为官方预测市场伙伴)

Grok 的未来愿景也令人惊艳,xAI 表示,未来版本将加入影片理解与游戏互动能力,能够游玩游戏并判断所谓「乐趣」,甚至整合游戏引擎自行创造互动与艺术内容。包括电视节目、电影作品与电玩游戏等。

语音方面,Grok 4 的表现也有重大升级。新版模型引入多种声音风格与口音,使对话更加自然且流畅。发布会上还刻意与GPT 做比较,凸显Grok 4 不仅不会打断使用者,也大大缩短了思考与回应的延迟时间,成为其介面的一大亮点。

Grok 4 不只是工具,更成人类文明推进器

Grok 4 的诞生,不仅代表AI 迈入更深入的思考与应用阶段,据马斯克所述,更有望引发一场横跨教育、科学、商业与创意产业的智慧革命,而Grok 将真正参与其中,而非仅是从旁协助的语言模型或辅助工具。

xAI 开发团队的未来愿景宏大而激进,他们强调:「AI 如今已不再只是帮我们思考,而是与我们共同创造世界。」

科技快讯 更多+
  • 纳斯达克上市公司KindlyMD计划发行50亿美元股票,扩大比特币财库业务

    2025-08-27 11:56
    8 月 27 日,据 The Block 报道,纳斯达克上市医疗服务公司 KindlyMD 周二宣布,已提交一份搁置注册声明,计划在市场上发行价值高达 50 亿美元的股票。该公司表示,计划将净收益用于支持一般公司用途,包括扩大其比特币财库。 该公司新闻稿称,该计划允许该公司通过包括道明证券、Cantor Fitzgerald 和 B. Riley Securities 在内的各种销售代理发行和出售最多价值 50 亿美元的普通股。
  • 受摩根大通投资承诺消息刺激,Numerai(NMR)持续拉升,24小时涨幅达123%

    2025-08-27 11:54
    8 月 27 日,据行情信息,Numerai(NMR)持续拉升,24 小时涨幅达 123%,现报价 17.91 美元。 此前报道,Numerai 获摩根大通最高 5 亿美元投资承诺。
  • 昨日美国以太坊现货ETF净流入4.55亿美元,比特币现货ETF净流入8810万美元

    2025-08-27 11:51
    8 月 27 日,据 Farside Investors 监测,昨日美国比特币现货 ETF 净流入 8810 万美元,其中 IBIT 净流入 4530 万美元,FBTC 净流入 1450 万美元。 此外,以太坊现货 ETF 净流入 4.55 亿美元,主力流入 ETF 为贝莱德 ETHA,净流入 3.231 亿美元。
  • SOL突破200美元,24小时涨幅达4.81%

    2025-08-27 11:47
    8 月 27 日,据 HTX 行情信息,SOL 突破 200 美元,现报价 200.1 美元,24 小时涨幅达 4.81%。
  • 数据:Aerodrome与Coinbase DEX集成后交易量增长30%

    2025-08-27 11:43
    8 月 27 日,据 Aerodrome Finance 数据,自 8 月 8 日与 Coinbase DEX 完成集成以来,交易量增长 30%。集成前两周 Aerodrome 交易量为 87 亿美元,而集成后两周交易量上升至 113 亿美元。
  • Metaplanet大量行使股票认购权并提前赎回部分债券

    2025-08-27 11:39
    8 月 27 日,Metaplanet Inc. 今日公告,在 2025 年 8 月 14 日至 26 日期间,EVO FUND 大量行使了第 20 系列股票认购权,共计 27,500,000 股,占总发行权的 14.86%。同时,公司利用认购权行使所得资金,对第 19 系列普通债券进行了 5,250,000,000 日元的部分提前赎回,这是继 7 月和 8 月初多次赎回后的又一次操作,累计已赎回 21,000,000,000 日元。 此次股票发行后,公司总发行股份增至 739,714,340 股,未行使的认购权减少至 460,000 权(相当于 46,000,000 股)。
  • 贝莱德旗下Securitize CEO:RWA代币化代表20万亿美元的市场潜力,以太坊是该领域的领先公链

    2025-08-27 11:33
    8 月 27 日,贝莱德旗下代币化资产发行方 Securitize CEO Carlos Domingo 通过以太坊官方 X 账号发文表示,RWA 代表着 20 万亿美元以上的市场潜力,但其中只有一小部分是在链上的。按市值计算,以太坊是 RWA 领域领先的区块链,但我们还处于早期阶段。即使 1% 的市场份额也能带来 2000 亿美元以上的机会。 Domingo 表示,Securitize 在链上原生铸造资产,其中 68%(超过 23 亿美元)在以太坊上。众多发行人认为,以太坊为代币化金融产品提供了最安全、可组合且抗审查的基础。代币化股票是将现实世界的金融市场引入链上的下一步。由于全球股票价值约为 100 万亿美元,因此很难夸大将这些资产锚定在以太坊上的长期机会。
  • 某鲸鱼向Hyperliquid存入1000万USDC,买入HYPE

    2025-08-27 11:29
    8 月 27 日,据链上分析师 Ai 姨(@ai_9684xtpa)监测,地址 0xFF0...24FbF 过去一小时从 Coinbase 提出 1000 万枚 USDC,随后充值进 Hyperliquid 买入了 价值 900 万美元的 HYPE,目前剩余 100 万美元挂了 49.306 美元的限价买单。
  • 查看更多

CopyRight 2024 www.bzxz.net All Rights Reserved 湘ICP备2023016450号-1

本网站所展示的内容均由用户自行上传发布,本站仅提供信息存储服务。若您认为其中内容侵犯了您的合法权益,请及时联系我们处理,我们将在核实后尽快删除相关内容。