首页 > 正文

AI周报|OpenAI发布大模型GPT-5;谷歌推出可交互的世界模型Genie 3

2025年08月10日 12:20
作者:郑栩彤
来源: 第一财经
编辑:东方财富网

手机上阅读文章

  • 提示:
  • 微信扫一扫
  • 分享到您的
  • 朋友圈

  OpenAI发布GPT-5

  当地时间8月7日,OpenAI推出基础大模型更新,GPT-5面世了。OpenAI表示,这是公司迄今为止最智能、最快、最有用的模型,有内置思维能力,可以将专家级智能交到每个人手中。这款模型在编程、数学、写作、健康、视觉智能等领域有最先进的性能,且知道何时应该快速响应、何时应该思考更长时间。目前GPT-5可供所有用户使用,但免费用户还需要等待几天时间才能使用完整的推理功能。

  点评:OpenAI强调GPT-5的幻觉率下降,而且对人类的“阿谀奉承”减少了。从基准测试看,GPT-5在不少基准测试中的得分超过o3和o4-mini,不过GPT-5的分数与前代模型的差距并没有很大。这款模型的能力能否代表最先进的人工智能水平,还需要观察。该模型发布后,特斯拉CEO马斯克表示,Grok 4在ARC-AGI基准测试中击败了GPT-5。

  OpenAI推出两款开源模型

  北京时间8月6日凌晨,OpenAI开源了gpt-oss-120b和gpt-oss-20b两个推理模型,这是OpenAI时隔六年再次开源模型。其中gpt-oss-120b参数量为1170亿,采用MoE(专家)架构,激活参数量51亿。gpt-oss-20b参数量为210亿,同样采用MoE架构,激活参数量36亿。gpt-oss-120b可以在单张80GB容量的GPU上运行,gpt-oss-20b可以在16GB内存的消费级设备上运行。

  点评:OpenAI的开闭源策略已发生转变。随着DeepSeek引领开源的方向,此前OpenAI CEO山姆·奥尔特曼(Sam Altman)就表示,OpenAI认为推出强大、有推理能力的新开源模型“非常重要”。不过,OpenAI还是倾向于在旗舰模型上采取闭源策略。新发布的两款开源模型参数量相对较小,适合部署在端侧设备上。

  Anthropic推出Claude Opus 4.1

  北京时间8月6日凌晨,AI创业公司Anthropic发布了Claude Opus 4.1,称这一模型是Opus 4在代理任务、现实世界编码和推理方面的升级版。这款模型主要是在深入研究、数据分析、代理(agentic)搜索方面的能力比前一代有所提升。Anthropic表示,新产品擅长处理复杂的多步骤问题,该公司将其定位为更有效的AI智能体(Agent)。

  点评:这款模型推出,也标志着Anthropic更频繁地推出产品渐进式更新。该公司表示,以往公司只专注于发布重大版本更新,此次更新意味着公司转向推动编码模型渐进式改进,公司还将在未来几周内推出更多更新。这种渐进式更新可以提高AI的可用性,这次推出的Claude Opus 4.1在代码编写、代理方面的迭代很实用。

  谷歌发布世界模型Genie 3,支持实时交互

  北京时间8月6日,谷歌发布新一代世界模型Genie 3,这是谷歌第一个允许进行实时交互的世界模型。该模型对世界物理特性的建模可以模拟水、光等自然现象,可以生成包含动物、植物在内的生态系统,还可以创造动画角色,并模拟复杂环境下各种元素的相互作用。在Genie 3生成的动态世界里,可以以每秒24帧的速度进行导航,并在720p的分辨率下保持长达几分钟的画面一致性,该模型的视觉记忆还可以追溯至一分钟前。

  点评:谷歌沿着世界模型的路径往前迈了一步。谷歌表示,世界模型是迈向AGI(通用人工智能)的关键垫脚石,因为世界模型允许AI智能体在丰富的模拟环境中不受限制地训练。这款新模型突破了世界模型的能力边界,不过仍有一些局限性,例如可执行的动作空间有限、难以在一个共享环境中模拟多个智能体的交互、难以准确模拟真实世界的位置、交互持续时长无法长达数小时。

  小红书开源多模态大模型dots.vlm1

  8月6日,小红书hi lab(人文智能实验室)开源了其首款多模态大模型dots.vlm1,这一模型基于DeepSeek V3打造,并配备了由小红书自研的12亿参数视觉编码器NaViT,具备多模态理解与推理能力。hi lab称,在主要的视觉评测集上,dots.vlm1的整体表现已接近当前领先模型,如Gemini 2.5 Pro与Seed-VL1.5 thinking。这一模型可以看懂复杂的图文交错图表,理解表情包背后的含义,分析两款产品的配料表差异,还能辨别博物馆中文物、画作名称。

  点评:小红书今年开始在大模型领域发力。6月6日,小红书开源了其首款大语言模型,并在之后开源了专用模型,以及视觉、奖励模型等前沿方向的研究成果。作为大模型界的新玩家,小红书的后续动作值得关注。

  马斯克宣布xAI将开源Grok-2大语言模型

  8月6日,特斯拉CEO埃隆·马斯克宣布,其创办的xAI公司将于下周开源Grok 2模型,进一步推进人工智能模型的开源策略。Grok 2最早于2024年8月13日以Beta版本形式发布,当时就因其出色的推理能力和独特的"反觉醒"特性备受关注。与第一代Grok相比,Grok 2在多个方面实现了显著提升,特别是在复杂问题处理和逻辑推理方面表现突出。

  点评: Grok 2此次开源将为开发者提供研究和应用xAI核心技术的机会,同时X平台正为订阅用户推出图片生成新功能,这意味着xAI在持续加码开源生态。

  2025年AI应用市场半年报:近七成原生App用户规模负增长

  8月5日消息,QuestMobile发布了《2025年AI应用市场半年报》。报告显示,2025上半年AI应用发展迅速,已经形成了四大梯队的产业格局。第一梯队由AI搜索引擎、AI综合助手这两个赛道组成,且一骑绝尘领先于其他赛道。截至6月,AI搜索引擎和AI综合助手的MAU分别达到了6.85亿和6.12亿。第二梯队由AI社交互动、AI专业顾问组成,月活跃用户规模分别为1.26亿、1.11亿。与此同时,原生APP市场进入洗牌期,整个上半年,近七成原生APP玩家月活跃用户规模出现负增长,尤其是手机厂商预装的AI手机助手,以及中长尾玩家,在使用场景缺失、同质化的问题影响下,增长乏力。

  点评:报告中还有一项备受关注的数据:DeepSeek的月活跃用户数从3月份的最高1.93亿下降到了6月份的1.62亿。然而这并不代表DeepSeek热潮的退潮,R1模型效应仍在,只不过渠道发生分流。QuestMobile数据显示,2025年5月,DeepSeek App流失用户中,56.0%使用了百度,42.1%使用了QQ浏览器,39.4%使用了豆包。

  AMD第二季度营收同比增长32%

  当地时间8月5日,AMD披露2025年第二季度财报。该季度AMD营收76.85亿美元,同比增长32%,创下季度新高,净利润则为8.72亿美元。第二季度,AMD数据中心收入同比增长14%,达到32亿美元,但未达到分析师预期。AMD表示,第二季度业绩受到贸易政策的影响,这些限制导致约8亿美元的库存及相关费用。当地时间8月6日,AMD股价下跌6.42%,8月7日涨5.69%,

  点评:AMD的业绩受到AI芯片出口限制一定的影响。该公司称,第二季度非GAAP毛利率为43%,如果剔除贸易政策带来的库存相关费用损失影响,该季度非GAAP毛利率约为54%。从市场需求看,AMD CEO苏姿丰则表示,市场对计算与AI产品组合的需求旺盛。该公司预计,未来季度中AI收入将同比增长。

  谷歌称AI搜索未致网站流量下滑

  大量研究表明,用户转向使用人工智能搜索功能和使用人工智能聊天机器人正在抢走出版商网站的流量。但谷歌否认了这一说法,谷歌的数据显示,与去年同期相比,来自该搜索引擎的点击量总体保持“相对稳定”,只是部分网站点击量有所增加,另一些则有所减少。谷歌副总裁兼搜索主管利兹·里德 (Liz Reid) 在一篇博客文章中写道:“这些数据与第三方报告形成鲜明对比,这些报告错误地指出了总流量的急剧下降——通常基于有缺陷的方法、孤立的例子或在搜索中推出人工智能功能之前发生的流量变化。”

  点评:谷歌认为一些第三方报告的研究结果有误。此前,皮尤研究中心发布报告称,当谷歌提供AI概览(即搜索结果顶部的AI生成摘要)时,用户“不太可能”点击链接。对此,里德还在博客中指出,谷歌的研究结果与一些基于“有缺陷的方法论”的第三方报告相矛盾。

(文章来源:第一财经)

(原标题:AI周报|OpenAI发布大模型GPT-5;谷歌推出可交互的世界模型Genie 3)

(责任编辑:6)

 
 
 
 

网友点击排行

 
  • 基金
  • 财经
  • 股票
  • 基金吧
 
郑重声明:天天基金网发布此信息目的在于传播更多信息,与本网站立场无关。天天基金网不保证该信息(包括但不限于文字、数据及图表)全部或者部分内容的准确性、真实性、完整性、有效性、及时性、原创性等。相关信息并未经过本网站证实,不对您构成任何投资决策建议,据此操作,风险自担。数据来源:东方财富Choice数据。

将天天基金网设为上网首页吗?      将天天基金网添加到收藏夹吗?

关于我们|资质证明|研究中心|联系我们|安全指引|免责条款|隐私条款|风险提示函|意见建议|在线客服|诚聘英才

天天基金客服热线:95021 |客服邮箱:vip@1234567.com.cn|人工服务时间:工作日 7:30-21:30 双休日 9:00-21:30
郑重声明:天天基金系证监会批准的基金销售机构[000000303]。天天基金网所载文章、数据仅供参考,使用前请核实,风险自负。
中国证监会上海监管局网址:www.csrc.gov.cn/pub/shanghai
CopyRight  上海天天基金销售有限公司  2011-现在  沪ICP证:沪B2-20130026  网站备案号:沪ICP备11042629号-1

A
安联基金安信基金
B
博道基金渤海汇金北京京管泰富基金百嘉基金贝莱德基金管理博时基金宝盈基金博远基金
C
长安基金长城基金长城证券财达证券淳厚基金创金合信基金长江证券(上海)资管长盛基金财通基金财通资管诚通证券长信基金财信基金财信证券
D
德邦基金德邦证券资管大成基金东财基金达诚基金东方阿尔法基金东方红资产管理东方基金东莞证券东海基金东海证券东吴基金东吴证券东兴基金东兴证券第一创业东证融汇证券资产管理
F
富安达基金蜂巢基金富达基金(中国)富国基金富荣基金方正富邦基金方正证券
G
光大保德信基金国都证券广发基金广发资产管理国海富兰克林基金国海证券国金基金国联安基金国联基金格林基金国联民生国联证券资产管理国融基金国寿安保基金国泰海通资管国泰基金国投瑞银基金国投证券国投证券资产管理国新国证基金国信资管国信证券国新证券股份工银瑞信基金国元证券
H
华安基金汇安基金华安证券华安证券资产管理汇百川基金华宝基金华宸未来基金华创证券泓德基金华富基金汇丰晋信基金海富通基金宏利基金汇泉基金华润元大基金华商基金惠升基金恒生前海基金华泰柏瑞基金华泰保兴基金红土创新基金汇添富基金红塔红土华泰证券(上海)资产管理华夏基金华西基金华鑫证券合煦智远基金华银基金恒越基金弘毅远方基金
J
嘉合基金金融街证券景顺长城基金嘉实基金九泰基金建信基金江信基金金信基金金鹰基金金元顺安基金交银施罗德基金