首页 > 正文

重磅发布!小米系全线大涨!“AI大模型大战”再起

2025年04月30日 14:43
来源: 券商中国
编辑:东方财富网

手机上阅读文章

  • 提示:
  • 微信扫一扫
  • 分享到您的
  • 朋友圈


K图 03896_0


K图 01810_0

  一则消息突然引爆。

  今日,小米系集体爆发,小米集团一度大涨超5%,金山云一度大涨超18%。消息面上,小米大模型微信公众号称,小米开源首个为推理(Reasoning)而生的大模型“Xiaomi MiMo”,联动预训练到后训练,全面提升推理能力。

  当前,AI大模型竞争再度进入白热化。4月29日,阿里巴巴通义千问发布了新版Qwen 3系列模型。同一天,世界首富马斯克也宣布,下周Grok 3.5早期测试版将向SuperGrok订阅者发布。

  券商机构分析认为,国内外大模型能力差距缩小,国产算力芯片持续进化,国内头部互联网厂商加大Capex投入,为国内AI突围之路奠定了基石。伴随国内外巨头大模型持续迭代,C端或有望迎来杀手级应用。

  全线大涨

  4月30日,小米系全线拉升,小米集团盘中一度大涨超5%,金山云一度大涨超18%,金山软件最高涨超6%。

  与此同时,港股云计算板块持续拉升,截至午间收盘,金蝶国际涨4.7%,中国软件国际涨2.72%,阿里巴巴-W涨1.48%

  据“小米大模型”公众号消息,今日,小米开源首个为推理(Reasoning)而生的大模型“Xiaomi MiMo”,联动预训练到后训练,全面提升推理能力。

  据介绍,在数学推理(AIME 24-25)和代码竞赛(LiveCodeBench v5)公开测评集上,MiMo以7B的参数规模,超越了OpenAI的闭源推理模型o1-mini和阿里Qwen更大规模的开源推理模型QwQ-32B-Preview。

  官方称,在相同RL训练数据情况下,MiMo-7B的数学&代码领域的强化学习潜力显著领先。MiMo-7B全系列模型均已开源。

  小米技术团队表示,MiMo的核心突破在于预训练与后训练阶段的协同优化。在预训练阶段,模型通过挖掘高质量推理语料并合成约2000亿tokens专项数据,采用三阶段渐进训练策略,累计训练量达25万亿tokens。

  后训练阶段则引入创新强化学习技术,包括自研的“Test Difficulty Driven Reward”算法和“Easy Data Re-Sampling”策略,有效提升模型在复杂任务中的稳定性。技术团队还开发了“Seamless Rollout”系统,使训练效率提升2.29倍,验证速度加快1.96倍。

  值得注意的是,小米官方表示,MiMo-7B在相同强化学习训练数据下,数学与代码领域的表现显著优于当前业界广泛使用的DeepSeek-R1-Distill-7B和Qwen2.5-32B模型。

  目前,小米已在HuggingFace平台开源MiMo-7B全系列4个模型,并发布详细技术报告。

  值得一提的是,就在小米宣布“Xiaomi Mimo”开源前,阿里巴巴通义千问于4月29日凌晨发布了新版Qwen 3 系列模型,包括2个MoE模型和6个dense模型。

  通义千问表示,作为Qwen系列全新一代的混合推理模型,Qwen 3在GPQA、AIME24/25、LiveCodeBench等多个权威评测中表现出极具竞争力的结果。在相同计算资源下,Qwen 3模型以更小的规模实现了对更大体量上一代模型的超越,真正做到了“小而强大”。

  Qwen 3融合了推理与非推理能力,在逻辑分析和创意生成等任务中表现卓越。预训练数据量达到约36万亿tokens,并通过多轮大规模强化学习与精细优化,在推理、工具调用、指令遵循及多语言能力等方面显著提升。

  “AI大模型大战”再起

  值得注意的是,AI大模型竞争再度进入白热化。

  4月29日,马斯克在社交平台上宣布,下周,Grok 3.5早期测试版将向SuperGrok订阅者发布,它是第一个能够准确回答有关火箭发动机或电化学技术问题的人工智能。马斯克称,Grok是从第一原理推理并得出互联网上根本不存在的答案。

  2025年以来,全球AI大模型的竞争愈发激烈,据不完全统计,在过去119天内,中美十家主要大模型公司就发布或更新了14款基础大模型。

  国际市场调研机构Artificial Analysis发布的报告显示,美国大模型虽然目前还领先,但中国的差距在不断缩小。

  西部证券指出,AI大模型能力提升和使用成本下降是主旋律,多模态或逐步成为未来基础模型的标配,进一步拉动算力需求。国内外大模型能力差距缩小,国产算力芯片持续进化,国内头部互联网厂商加大Capex投入,为国内AI突围之路奠定了基石。

  开源证券认为,AI Agent为以大语言模型(LLM)为驱动,具有自主理解、感知、规划、记忆和使用工具的能力,能自动执行复杂任务的系统。不同于传统人工智能,AI Agent具备通过独立思考、调用工具逐步完成给定目标的能力。看好AI Agent应用将在2025年多点开花,其中AI Agent有望在B端率先商业化,电商、营销、CRM、金融、法律等场景加速落地。伴随国内外巨头大模型持续迭代,C端或有望迎来杀手级应用。

  天风证券表示,通义千问体系在模型能力、硬件能力及生态建设上保持领先,已实现全模态覆盖,成为全球最大模型开源生态。其自主算力体系较强,覆盖通用计算与智算需求,在自主可控行业具有优势。AI Agent市场规模有望超万亿,通义千问凭借在B端资源禀赋及深厚技术积淀,已发布多行业垂直生态体系,有望成为B端Agent链主,相关生态体系公司或将受益。





(文章来源:券商中国)

(原标题:重磅发布!刚刚,全线大涨!)

(责任编辑:6)

 
 
 
 

网友点击排行

 
  • 基金
  • 财经
  • 股票
  • 基金吧
 
郑重声明:天天基金网发布此信息目的在于传播更多信息,与本网站立场无关。天天基金网不保证该信息(包括但不限于文字、数据及图表)全部或者部分内容的准确性、真实性、完整性、有效性、及时性、原创性等。相关信息并未经过本网站证实,不对您构成任何投资决策建议,据此操作,风险自担。数据来源:东方财富Choice数据。

将天天基金网设为上网首页吗?      将天天基金网添加到收藏夹吗?

关于我们|资质证明|研究中心|联系我们|安全指引|免责条款|隐私条款|风险提示函|意见建议|在线客服|诚聘英才

天天基金客服热线:95021 |客服邮箱:vip@1234567.com.cn|人工服务时间:工作日 7:30-21:30 双休日 9:00-21:30
郑重声明:天天基金系证监会批准的基金销售机构[000000303]。天天基金网所载文章、数据仅供参考,使用前请核实,风险自负。
中国证监会上海监管局网址:www.csrc.gov.cn/pub/shanghai
CopyRight  上海天天基金销售有限公司  2011-现在  沪ICP证:沪B2-20130026  网站备案号:沪ICP备11042629号-1

A
安联基金安信基金
B
博道基金渤海汇金北京京管泰富基金百嘉基金贝莱德基金管理博时基金宝盈基金博远基金
C
长安基金长城基金长城证券财达证券淳厚基金创金合信基金长江证券(上海)资管长盛基金财通基金财通资管诚通证券长信基金财信基金财信证券
D
德邦基金德邦证券资管大成基金东财基金达诚基金东方阿尔法基金东方红资产管理东方基金东莞证券东海基金东海证券东吴基金东吴证券东兴基金东兴证券第一创业东证融汇证券资产管理
F
富安达基金蜂巢基金富达基金(中国)富国基金富荣基金方正富邦基金方正证券
G
光大保德信基金国都证券广发基金广发资产管理国海富兰克林基金国海证券国金基金国联安基金国联基金格林基金国联民生国联证券资产管理国融基金国寿安保基金国泰海通资管国泰基金国投瑞银基金国投证券国投证券资产管理国新国证基金国信资管国信证券国新证券股份工银瑞信基金国元证券
H
华安基金汇安基金华安证券华安证券资产管理汇百川基金华宝基金华宸未来基金华创证券泓德基金华富基金汇丰晋信基金海富通基金宏利基金汇泉基金华润元大基金华商基金惠升基金恒生前海基金华泰柏瑞基金华泰保兴基金红土创新基金汇添富基金红塔红土华泰证券(上海)资产管理华夏基金华西基金华鑫证券合煦智远基金华银基金恒越基金弘毅远方基金
J
嘉合基金金融街证券景顺长城基金嘉实基金九泰基金建信基金江信基金金信基金金鹰基金金元顺安基金交银施罗德基金