首页 > 正文

Grok4成“宇宙最强模型”?AI竞赛进入“马斯克节奏”

2025年07月11日 00:10
来源: 21世纪经济报道
编辑:东方财富网

手机上阅读文章

  • 提示:
  • 微信扫一扫
  • 分享到您的
  • 朋友圈
摘要
【Grok4成“宇宙最强模型”?AI竞赛进入“马斯克节奏”】“宇宙最强模型”“它比所有领域的人类博士都聪明,无一例外”“Grok 4还没发明新科学或新物理定律只是时间问题”“Grok 4解决代码问题,比Cursor更好用”……以上宣言,是马斯克为旗下AI公司xAI最新旗舰大模型Grok 4的定调。据悉,Grok已经被配置在了特斯拉最新固件里,未来也将通过人形机器人与现实世界交互。

  虽然马斯克本人一脸疲态,但他亲自坐镇,给Grok 4的噱头拉到顶配。

  “宇宙最强模型”“它比所有领域的人类博士都聪明,无一例外”“Grok 4还没发明新科学或新物理定律只是时间问题”“Grok 4解决代码问题,比Cursor更好用”……

  以上宣言,是马斯克为旗下AI公司xAI最新旗舰大模型Grok 4的定调。

  Grok 4也确实争气,在“人类最后的考试”(Humanity's Last Exam)中,拿到了38.6%的准确率,超过了谷歌Gemini 2.5 Pro的21.6%和OpenAI o3的21%。多智能体版本Grok 4 Heavy拿到了44.4%,如果进一步使用工具辅助,则能达到50.7%。

  这背后,是“暴力计算美学”,xAI耗时6个月搭建起来的10万块H100 GPU超级算力中心正在给出回报,Grok 4的训练量是Grok 3的10倍,是Grok 2的100倍。

  回归商业世界的马斯克火力全开,接下来还计划 8 月推出代码模型,9 月上线多模态智能代理,10 月发布视频生成模型。

  据悉,Grok已经被配置在了特斯拉最新固件里,未来也将通过人形机器人与现实世界交互。

  AI大模型、自动驾驶、人形机器人商业航天,马斯克的AI帝国正在越来越宏大,节奏也更甚从前。

  Grok 4有多能打?

  在多个高难度基准测试中,Grok 4表现出色。

  马斯克在直播中强调,Grok 4在人文、数学、物理、工程等学科均达到博士以上水平,“比几乎所有学科的研究生更聪明”。

  推理能力刷新纪录。Grok 4 拿到历史高分的“人类最后的考试”,是一份被称为“AI 世界终极试炼”的测试合集,这份专门针对AI的考卷,覆盖了数学、化学、语言学、自然科学等一百多个学科,大模型在这份测试中无法依赖网络搜索,只能凭自己的理解和推理能力作答。

  能应对这份考卷的Grok 4,推理能力有大幅提升,可以减少对现有知识框架的依赖。

  除HLE测试领先外,Grok 4在GPQA(研究生级问答)中拿到了88.9%,在美国数学邀请赛(AIME25)中拿下满分,ARC-AGI-2测试中以16.2%得分登顶(超第二名Claude Opus 4近一倍)。

  商业场景的落地验证方面,在名为 Vending-Bench 的商业模拟任务中,Grok 4 也表现突出,经营自动售货机时平均净资产达到 4684.15 美元,是第二名的两倍,证明了长期规划和多步骤推理能力。

  值得注意的是,Grok 4的创新点在于“工具原生融合”架构。与多数模型后期接入工具不同,Grok 4在训练阶段嵌入了搜索、代码执行等工具,使其能灵活调用资源解决复杂问题。例如直播演示中,它通过检索学术论文、调用模拟工具,生成了黑洞碰撞的可视化动态模型。

  不过,业内人士认为,Grok 4 的强项主要集中在推理和复杂知识整合方面,而在代码、多模态、图像和视频生成等方面还有进步空间。

  “最贵”模型的想象空间

  xAI同步推出了行业最贵订阅计划:Super Grok Heavy月费高达300美元,较OpenAI顶级订阅贵50%。API定价同样激进,每百万token输入3美元、输出15美元。

  高定价背后其实是训练成本的陡增。Grok 4百倍于前代的训练量,依托10万块H100 GPU集群完成,xAI并未披露单次训练耗资,但马斯克提到的“我们快没有合适问题考验AI了”,侧面印证了模型能力已逼近当前测试极限。

  Grok 4的终极目标是与现实世界交互。马斯克透露,今年Grok 4还将融合有限元分析、流体动力学等工具,构建高精度物理模拟器(如黑洞模拟)。在他的规划中,Grok 4将通过Optimus(马斯克旗下的擎天柱)人形机器人连接现实,“让AI接受物理定律的最终检验”。另有消息显示,目前特斯拉最新固件已预埋Grok,未来或将作为车载语音助手及自动驾驶的“大脑”。

  “我们正站在智能大爆炸的开端。”马斯克表示,对AI的最终测试是现实世界,未来AI技术将会放到改进汽车或火箭等领域验证有效性。

  “睡在算力中心”的掌舵人归来

  从特斯拉Robotaxi(无人驾驶出租车)秀肌肉,到Grok 4的暴力美学,近10天,马斯克已经称霸舆论场两回,他正以标志性的激进节奏推进业务。

  马斯克所布局的自动驾驶、AI大模型、人形机器人商业航天,逐渐形成闭环。Grok大模型作为“大脑”,驱动特斯拉自动驾驶、Optimus机器人行动决策;特斯拉车辆与机器人反馈的真实场景数据,反哺模型迭代;其旗下SpaceX星链提供全球低延迟通信,支撑实时AI交互。

  OpenAI的ChatGPT-5还在酝酿中,目前AI军备竞赛进入“马斯克节奏”。马斯克的算力碾压、多场景捆绑,确实具有更宽广的应用想象力。

  但在AI大模型快速迭代的当下,有多少用户愿意为了300美元月费的Grok 4买单,还是未知数。

  高调背后也暗藏风险。Grok近期因发表反犹言论遭土耳其封禁、波兰政府投诉,迫使xAI紧急删除不当内容并调整审核策略。在“AI寻求真理”的路上,如何在开放性与安全性间平衡,不只是OpenAI 塞姆·奥特曼的难题,也是马斯克的。

  马斯克在今天的直播中说:“安全是最重要的事,我们需要确保AI是一个好AI。你可以把AI看作是超级天才的孩子,它最终会比你聪明,但我们仍然要灌输正确的价值观。”


(文章来源:21世纪经济报道)

(原标题:Grok4成“宇宙最强模型”?AI竞赛进入“马斯克节奏”)

(责任编辑:73)

 
 
 
 

网友点击排行

 
  • 基金
  • 财经
  • 股票
  • 基金吧
 
郑重声明:天天基金网发布此信息目的在于传播更多信息,与本网站立场无关。天天基金网不保证该信息(包括但不限于文字、数据及图表)全部或者部分内容的准确性、真实性、完整性、有效性、及时性、原创性等。相关信息并未经过本网站证实,不对您构成任何投资决策建议,据此操作,风险自担。数据来源:东方财富Choice数据。

将天天基金网设为上网首页吗?      将天天基金网添加到收藏夹吗?

关于我们|资质证明|研究中心|联系我们|安全指引|免责条款|隐私条款|风险提示函|意见建议|在线客服|诚聘英才

天天基金客服热线:95021 |客服邮箱:vip@1234567.com.cn|人工服务时间:工作日 7:30-21:30 双休日 9:00-21:30
郑重声明:天天基金系证监会批准的基金销售机构[000000303]。天天基金网所载文章、数据仅供参考,使用前请核实,风险自负。
中国证监会上海监管局网址:www.csrc.gov.cn/pub/shanghai
CopyRight  上海天天基金销售有限公司  2011-现在  沪ICP证:沪B2-20130026  网站备案号:沪ICP备11042629号-1

A
安联基金安信基金
B
博道基金渤海汇金北京京管泰富基金百嘉基金贝莱德基金管理博时基金宝盈基金博远基金
C
长安基金长城基金长城证券财达证券淳厚基金创金合信基金长江证券(上海)资管长盛基金财通基金财通资管诚通证券长信基金财信基金财信证券
D
德邦基金德邦证券资管大成基金东财基金达诚基金东方阿尔法基金东方红资产管理东方基金东莞证券东海基金东海证券东吴基金东吴证券东兴基金东兴证券第一创业东证融汇证券资产管理
F
富安达基金蜂巢基金富达基金(中国)富国基金富荣基金方正富邦基金方正证券
G
光大保德信基金国都证券广发基金广发资产管理国海富兰克林基金国海证券国金基金国联安基金国联基金格林基金国联证券资产管理国融基金国寿安保基金国泰海通资管国泰基金国投瑞银基金国投证券国投证券资产管理国新国证基金国信资管国信证券工银瑞信基金国元证券
H
华安基金汇安基金华安证券华安证券资产管理汇百川基金华宝基金华宸未来基金华创证券泓德基金华富基金汇丰晋信基金海富通基金宏利基金汇泉基金华润元大基金华商基金惠升基金恒生前海基金华泰柏瑞基金华泰保兴基金红土创新基金汇添富基金红塔红土华泰证券(上海)资产管理华夏基金华西基金华鑫证券合煦智远基金华银基金恒越基金弘毅远方基金
J
嘉合基金金融街证券景顺长城基金嘉实基金九泰基金建信基金江信基金金信基金金鹰基金金元顺安基金交银施罗德基金