首页 > 正文

轻量级模型密集发布 未来端侧AI将带动创新主线

2024年07月23日 18:15
来源: 第一财经
编辑:东方财富网

手机上阅读文章

  • 提示:
  • 微信扫一扫
  • 分享到您的
  • 朋友圈

  近日,OpenAI 发布新款轻量级大模型GPT-4o mini,引发行业对轻量级模型与端侧模型落地的讨论。

  2024年是端侧模型落地应用的年份,多家企业对记者表示,今年重点放在应用落地、商业化变现方面。申万菱信基金经理廖裕舟表示, OpenAI推出的GPT-4o或标志着AI正式走向端侧,走进用户,这使得AI应用落地变得更加清晰可见。

  逻辑上,轻量级模型和端侧模型都旨在降低模型的计算复杂度和存储需求,以便在资源受限的设备上高效运行。只是在实现方法上,轻量化模型通常通过模型剪枝、量化、知识蒸馏等技术来减少模型大小和提高运行效率。端侧模型侧重于将这些轻量化技术应用于终端设备上,以实现快速响应和低延迟。

  在轻量级模型技术发展与端侧模型不断落地的推动下,廖裕舟认为未来端侧AI带动的创新主线有望拉动电子行业进入新的增长周期,A股硬科技公司或将迎来估值重塑阶段。

  轻量级模型密集发布

  2024年,多家厂商先后发布轻量级模型。2月,谷歌发布比Gemini更小、更轻的版本Gemma,包括Gemma 2B(20 亿参数)与Gemma 7B(70 亿参数)两个版本,可以在台式机或者笔记本电脑上本地运行;4月,苹果研究团队在Hugging Face模型库上发布包含四种小型语言模型的OpenELM系列,包括2.7亿参数、4.5亿参数、11亿参数及30亿参数;7月,法国AI创企Mistral AI推出面向程序员和开发人员的代码生成模型Codestral Mamba 7B,以及专为数学相关推理和科学发现而设计的AI模型Mathstral 7B。

  最近的动态是OpenAI发布轻量级大模型GPT-4o mini,OpenAI官网文章称,“我们预计GPT-4o mini将扩大人工智能的应用,让人工智能变得更实惠。”GPT-4o mini输入价格为15美分(0.15美元)/百万tokens(词元),输出价格为60美分(0.6美元)/百万tokens,比GPT-3.5 Turbo便宜60%。

  面壁智能联合创始人、CEO李大海猜测,GPT-4o mini可能是一个“宽 MOE”(expert的数量比较多)的模型,而非端侧模型。作为一个性价比很高的云端模型,GPT-4o mini一方面将云端API市场卷到了一个新高度,另一方面也极大降低大模型落地产业成本,令行业对大规模行业应用的兴起抱有更强信心。

  李大海认为,OpenAI的轻量级模型体现出在不断提升大模型参数的方向之外,行业在更小尺寸方向上追求高效高性能,这是另一条挖掘智能潜力极限、又可降低成本的路径。他称,大模型的科学化,对底层的洞察、对模型规模能力的预测,越来越成为大模型研究的核心能力。行业认知底层达成了某种一致:知识密度是大模型另一个核心指标,且越来越重要。

  在面壁智能看来,知识密度是模型能力除以参与计算的模型参数,类似芯片制程。而模型知识密度每8个月提高1倍,伴随终端算力持续增强,轻量高性能模型潜力极大。

  轻量级模型的设计目标是在保持模型性能的同时减少模型的计算复杂度、参数数量和模型大小,使其更适合在资源受限的设备上运行,这使得知识密度成为其中一个关键考量因素。面壁智能的方式是在真正训练一个模型之前,在沙盒里做演练,高效寻找最优数据、超参配置,再外推到大模型上。2024年2月,面壁智能推出的MiniCPM 2.4B版本模型,具备超过Llama2-13B的能力。

  如果类比芯片行业,清华大学计算机系长聘副教授、面壁智能首席科学家刘知远表示,过去80多年的时间里,芯片制程的不断增强带来终端算力的提升,进而推动算力小型化。大模型的发展也会持续提升模型制程,带动模型知识密度的增强,两者的交汇点便是未来端侧智能的潜力。

  端侧承接AI落地

  基座模型厂商推动轻量级AI技术发展,端侧不断开拓场景进行承接,在产业链上满足模型应用落地的需求,具体包括PC、手机、XR、汽车、物联网等。Canalys预测,兼容AI的PC有望在2027年渗透率达到60%。AI手机方面,三星、小米等厂商在大模型及操作系统等方面持续探索。

  端侧AI并非新事物,2020年时任华为诺亚方舟实验室技术专家王云鹤便分享过端侧AI模型的技术发展。李大海对记者表示,过去行业没有关注端侧,或暂未出现高质量的端侧模型,便只能云端模型来做事情。当云端模型不够用,便针对性进行微调。

  如今,李大海称,端侧模型在技术发展推动下,将大模型科技生态的拼图拼得更完整,所带来的好处如隐私安全,未来很多场景也会对终端推理可靠性提出要求,这也是端侧非常好的落地方向。

  赛迪顾问电子信息和人工智能产业研究中心分析师杨天宇将AIPC视为推动大模型落地最重要的第一终端,主因从算力承载力来看,PC较手机、智能手表等其他终端产品体积更大,能够配置更强处理器、内存等部件,具有支持百亿级参数大模型运行的能力;从算力应用场景来看,PC较其他终端产品的应用领域更加广阔,能够承载娱乐、生活、工作等多场景,有利于推动端侧大模型的应用推广。

  但需注意的是,端侧模型是一件复杂工程,需要硬件、系统、算力等多方配合,即便如微软、谷歌等大厂在端侧部署的反馈成果也差强人意。NVIDIA亚太区高级产品市场总监许哲铭认为,AIPC现在是当红最热门话题之一,而当下的AI跟以往AI有一个根本上的不同——现在的AI绝大部分是生成式AI。因此从算力资源的角度来看,本地应配备一个GPU,对生成式AI进行运算,满足生产力上的需求。另外软件侧的解决方案效率也决定了整个系统运行的效率,如NVIDIATensorRT。许哲铭对记者表示,端侧模型中,NVIDIA也好,大模型厂商也好,包括硬件厂商,都应参与进来,共同建设生态。

  软通动力相关负责人对记者表示,目前大模型平台在端侧AI方面的表现每年都有大幅提升,尤其是AIPC具有先天算力优势,这使其在本地就可处理绝大多数应用负载,减少了云端压力,降低了企业AI应用的云服务费用。同时需注意的是,端侧需要平衡效率与功耗,多模态大模型在端侧运行也面临较大的效率挑战。总体而言,端侧AI的发展前景广阔,但需要进一步优化以满足不同场景的需求。

  另外针对云端协同,该负责人称,端侧AI的发展推动了端云协同的普及,这种模式不仅是一种智能推理的方式,更是模型进化的革新范式。目前国内市场在端侧部署方面更侧重于私有化部署,特别是在政务和科研场景中,私有云的应用得到了广泛落地。同时,轻量化大模型和NPU等技术的发展也促进了AI在端侧本地化部署。总体来看,端云协同已成为未来大模型应用的主流模式。当越来越多AI项目的ROI都能跑通,在商业端得到验证,形成正向循环,这种改变一定会加速,行业“入口”也可能会随之改变。

(文章来源:第一财经)

(原标题:轻量级模型密集发布,未来端侧AI将带动创新主线)

(责任编辑:3)

 
 
 
 

网友点击排行

 
  • 基金
  • 财经
  • 股票
  • 基金吧
 
郑重声明:天天基金网发布此信息目的在于传播更多信息,与本网站立场无关。天天基金网不保证该信息(包括但不限于文字、数据及图表)全部或者部分内容的准确性、真实性、完整性、有效性、及时性、原创性等。相关信息并未经过本网站证实,不对您构成任何投资决策建议,据此操作,风险自担。数据来源:东方财富Choice数据。

将天天基金网设为上网首页吗?      将天天基金网添加到收藏夹吗?

关于我们|资质证明|研究中心|联系我们|安全指引|免责条款|隐私条款|风险提示函|意见建议|在线客服|诚聘英才

天天基金客服热线:95021 |客服邮箱:vip@1234567.com.cn|人工服务时间:工作日 7:30-21:30 双休日 9:00-21:30
郑重声明:天天基金系证监会批准的基金销售机构[000000303]。天天基金网所载文章、数据仅供参考,使用前请核实,风险自负。
中国证监会上海监管局网址:www.csrc.gov.cn/pub/shanghai
CopyRight  上海天天基金销售有限公司  2011-现在  沪ICP证:沪B2-20130026  网站备案号:沪ICP备11042629号-1

A
安信基金安信证券资产
B
北信瑞丰博远基金北京京管泰富基金渤海汇金宝盈基金博道基金百嘉基金博时基金贝莱德基金管理
C
长信基金诚通证券长城基金长安基金财达证券长江证券(上海)资管财通资管淳厚基金创金合信基金财信证券长城证券长盛基金财通基金
D
大成基金东证融汇证券资产管理达诚基金东吴基金第一创业东兴基金东兴证券德邦证券资管东海证券东财基金东方阿尔法基金德邦基金东海基金东吴证券东方红资产管理东莞证券东方基金
F
蜂巢基金富达基金(中国)富国基金方正证券富荣基金方正富邦基金富安达基金
G
国海富兰克林基金国元证券广发资产管理国寿安保基金国联安基金国联证券资产管理光大保德信基金国投证券国联证券国都证券国海证券国新国证基金国泰基金国新证券股份国金基金国信证券国融基金格林基金广发基金国联基金工银瑞信基金国投瑞银基金
H
华润元大基金华泰证券(上海)资产管理华宸未来基金华泰柏瑞基金华富基金宏利基金华鑫证券汇百川基金汇丰晋信基金华安基金华商基金红土创新基金华泰保兴基金弘毅远方基金华安证券华西基金泓德基金汇泉基金合煦智远基金恒越基金惠升基金汇安基金恒生前海基金华夏基金红塔红土恒泰证券华创证券汇添富基金华宝基金海富通基金
J
嘉实基金建信基金金元顺安基金交银施罗德基金九泰基金景顺长城基金嘉合基金金信基金金鹰基金江信基金