首页 > 正文

“小米系”暴涨!小米开源MiMo推理大模型

2025年04月30日 19:34
来源: 证券时报网
编辑:东方财富网

手机上阅读文章

  • 提示:
  • 微信扫一扫
  • 分享到您的
  • 朋友圈

  小米进军大模型,最擅长“以小博大”。

  4月30日,小米宣布开源首个为推理而生的大模型Xiaomi MiMo。值得注意的是,其经过强化学习训练形成的MiMo-7B-RL模型,用仅仅70亿的参数,在多项权威基准测试中得分超过了OpenAI的闭源推理模型o1-mini 和阿里通义千问320亿参数的QwQ-32B-Preview,实现了“以小博大”。

  受此消息影响,今日小米股价涨5.37%,金山云金山软件更是分别大涨14.20%和7.07%。业内人士认为,小米作为国产头部的手机品牌厂商,此次开源的小参数规模模型展现了较强的性能,为AI在手机端侧的应用和运行提供了更坚实的模型基础。

  小米开源MiMo推理大模型

  4月30日,小米宣布开源首个为推理而生的大模型Xiaomi MiMo。据介绍,在数学推理(AIME 24-25)和代码竞赛(LiveCodeBench v5)公开测评集上,MiMo仅用7B的参数规模,超越了OpenAI的闭源推理模型o1-mini和阿里Qwen更大规模的开源推理模型 QwQ-32B-Preview。

图片

  以70亿的小规模参数,实现了卓越的性能,MiMo展现了小米“以小博大”的能力。据悉,这一成绩的取得,主要源于团队在预训练和后训练的数据和算法方面进行了多层组合创新努力。预训练是让模型领略更多的推理模型,而后训练则是打磨高效稳定的强化学习算法及框架。

  具体来看,MiMo背后包含了许多技术细节,包括使用改进的组相对策略优化(GRPO)算法进行训练,移除KL(Kullback-Leibler散度)损失、动态采样和增加上界裁剪等策略;提出测试难度驱动的奖励机制,将测试用例按难度分组,并根据难度分配奖励;采用易数据过滤和重采样策略,提高采样效率并稳定策略更新等等。

  小米大模型团队也已公开了MiMo的技术报告,展现了相关的技术细节。此外,MiMo-7B全系列已开源,包括预训练模型MiMo-7B-Base,监督微调模型MiMo-7B-SFT以及强化学习模型MiMo-7B-RL和MiMo-7B-RL-Zero。

  小米大模型团队表示,MiMo来自于全新成立不久的“小米大模型Core团队”的初步尝试。业内人士普遍认为,MiMo的开源标志着AI发展从盲目追求参数规模转向注重算法效率和能力密度的理性发展期,通过技术创新,小模型同样可以实现高效率、大智慧,带来“性价比革命”。

  小米全面发力AI大模型

  随着MiMo模型的开源,小米刚刚成立不久的小米大模型Core团队也终于浮出水面。小米创始人雷军曾在2023年表示,自2016年组建AI团队以来,到2023年4月第一时间成立专职大模型团队,经过多次扩展,小米AI团队相关人员规模已达3000多人,逐步建立了视觉、语音、声学、知识图谱、NLP、机器学习、多模态等AI技术能力。

  小米大力“押宝”大模型早在去年底便已有消息传出。DeepSeek-V3爆火之后,背后的AI“天才少女”罗福莉引发了大众的关注,彼时就有媒体报道称,雷军以千万年薪招揽DeepSeek开源大模型DeepSeek-V2的关键开发者之一罗福莉,领导小米AI大模型团队。

  此外,小米也搭建了自己的GPU万卡集群,并持续提升算力储备,为大模型研发提供更充分的算力供给。今年3月,小米发布2024年报,明确2025年将投入70亿元以上资金用于AI研发,约占总研发经费的1/4,重点聚焦AI基础设施、大模型开发及应用场景搭建。

  从招兵买马到“补充弹药”,小米全面发力AI大模型,将AI视为下一个“新战场”。值得注意的是,与其他大模型厂商追求高性能、大参数不同,小米大模型主攻轻量化、本地部署,也是业界第一个在手机芯片上跑通十亿参数规模大语言模型,验证了端侧小模型在部分目标场景可以取得媲美云端大模型效果。

  雷军曾表示,“小米拥有品类众多的设备,是全球规模领先的消费级物联网平台。设备多样,使用场景也各不相同,一个大模型难以兼顾。如果把一部分大模型能力下放到端侧,不仅能更好地保护用户隐私、而且有机会在本地实现千人千面的个性化定制。”因此,在训练策略上,小米一直致力于减少参数的浪费,达到效率和效果的最佳均衡。

  同时,小米发力AI,致力于将大模型与自身业务深度协同,围绕硬件生态做深场景,让AI真正服务于产品。目前,小米的AI技术能力已逐步接入手机、汽车、AIoT、机器人等业务板块,端侧赋能加速。业内人士认为,小米作为国产头部的手机品牌厂商,此次开源的小参数规模模型展现了较强的性能,为AI在手机端侧的应用和运行提供了更坚实的模型基础。

  中信建投研报表示,大模型能力不断迭代增长,但模型之间差异在缩小。这些技术需要在终端设备上应用落地,最终通过这些应用/终端实现商业价值的转化,从而形成一个从投资到变现的完整闭环。目前,Meta、字节、小米等巨头已经开始大力布局端侧AI,抢夺AI Agent入口。除了手机、PC、眼镜、耳机外,潜在的端侧AI基数巨大,家电、机器人、智能车、教育办公设备、玩具等都受益于端侧AI的趋势,AI嵌入将带来广泛的硬件升级。重点关注算力、存储、连接、电力等硬件环节。

(文章来源:证券时报网)

(原标题:“小米系”暴涨!啥情况?最新发布→)

(责任编辑:18)

 
 
 
 

网友点击排行

 
  • 基金
  • 财经
  • 股票
  • 基金吧
 
郑重声明:天天基金网发布此信息目的在于传播更多信息,与本网站立场无关。天天基金网不保证该信息(包括但不限于文字、数据及图表)全部或者部分内容的准确性、真实性、完整性、有效性、及时性、原创性等。相关信息并未经过本网站证实,不对您构成任何投资决策建议,据此操作,风险自担。数据来源:东方财富Choice数据。

将天天基金网设为上网首页吗?      将天天基金网添加到收藏夹吗?

关于我们|资质证明|研究中心|联系我们|安全指引|免责条款|隐私条款|风险提示函|意见建议|在线客服|诚聘英才

天天基金客服热线:95021 |客服邮箱:vip@1234567.com.cn|人工服务时间:工作日 7:30-21:30 双休日 9:00-21:30
郑重声明:天天基金系证监会批准的基金销售机构[000000303]。天天基金网所载文章、数据仅供参考,使用前请核实,风险自负。
中国证监会上海监管局网址:www.csrc.gov.cn/pub/shanghai
CopyRight  上海天天基金销售有限公司  2011-现在  沪ICP证:沪B2-20130026  网站备案号:沪ICP备11042629号-1

A
安联基金安信基金
B
博道基金渤海汇金北京京管泰富基金百嘉基金贝莱德基金管理博时基金宝盈基金博远基金
C
长安基金长城基金长城证券财达证券淳厚基金创金合信基金长江证券(上海)资管长盛基金财通基金财通资管诚通证券长信基金财信基金财信证券
D
德邦基金德邦证券资管大成基金东财基金达诚基金东方阿尔法基金东方红资产管理东方基金东莞证券东海基金东海证券东吴基金东吴证券东兴基金东兴证券第一创业东证融汇证券资产管理
F
富安达基金蜂巢基金富达基金(中国)富国基金富荣基金方正富邦基金方正证券
G
光大保德信基金国都证券广发基金广发资产管理国海富兰克林基金国海证券国金基金国联安基金国联基金格林基金国联民生国联证券资产管理国融基金国寿安保基金国泰海通资管国泰基金国投瑞银基金国投证券国投证券资产管理国新国证基金国信资管国信证券国新证券股份工银瑞信基金国元证券
H
华安基金汇安基金华安证券华安证券资产管理汇百川基金华宝基金华宸未来基金华创证券泓德基金华富基金汇丰晋信基金海富通基金宏利基金汇泉基金华润元大基金华商基金惠升基金恒生前海基金华泰柏瑞基金华泰保兴基金红土创新基金汇添富基金红塔红土华泰证券(上海)资产管理华夏基金华西基金华鑫证券合煦智远基金华银基金恒越基金弘毅远方基金
J
嘉合基金金融街证券景顺长城基金嘉实基金九泰基金建信基金江信基金金信基金金鹰基金金元顺安基金交银施罗德基金