首页 > 正文

DeepSeek重大发布!DeepEP向公众开放 芯片需求大增

2025年02月25日 14:59
作者:时谦
来源: 证券时报网
编辑:东方财富网

手机上阅读文章

  • 提示:
  • 微信扫一扫
  • 分享到您的
  • 朋友圈
摘要
【DeepSeek最新发布!DeepEP向公众开放 芯片需求大增】据悉,DeepEP是MoE模型训练和推理的ExpertParallelism通信基础,可实现高效优化的全到全通信,以支持包括FP8在内的低精度计算,适用于现代高性能计算。DeepEP还针对从NVLink到RDMA的非对称带宽转发场景进行了深度优化,不仅提供高吞吐量,还支持流式多处理器数量控制,从而在训练和推理任务中实现高吞吐量性能。

  DeepSeek开源周第二弹!

  上周五,DeepSeek宣布连续五天开源五大软件库。今天DeepSeek选择了先在GitHub上线,然后再在官推发布上新通知。该公司今日宣布将DeepEP向公众开放。在宣布后的约20分钟内,DeepEP已在GitHub、微软(MSFT.US)等平台上获得超过1000个Star收藏。

  据悉,DeepEP是MoE模型训练和推理的ExpertParallelism通信基础,可实现高效优化的全到全通信,以支持包括FP8在内的低精度计算,适用于现代高性能计算。DeepEP还针对从NVLink到RDMA的非对称带宽转发场景进行了深度优化,不仅提供高吞吐量,还支持流式多处理器数量控制,从而在训练和推理任务中实现高吞吐量性能。

  此外,券商中国记者在DeepSeek API开放平台注意到,DeepSeek已重新开放API充值。DeepSeek-Chat模型优惠期结束,调用价格已变更为每百万输入tokens 2元,每百万输出tokens 8元。此前因资源紧张,DeepSeek曾一度停止充值。

  DeepEP向公众开放

  今天是DeepSeek开源第二天,他们一大早在官推上发布消息,开源DeepEP。

  DeepSeek在官推上介绍,很高兴介绍DeepEP第一个用于MoE模型训练和推理的开源EP通信库。其特点包括:高效且优化的全对全通信,通过NVLink和RDMA支持节点内和节点间,用于训练和推理预填充的高吞吐量内核,用于推理解码的低延迟内核,原生FP8调度支持,灵活的GPU资源控制,用于计算通信重叠。

  资料显示,使用混合专家(MoE)架构的大型语言模型在计算量没有相应增加的情况下,显著提高了模型容量。然而,这种方法也带来了挑战——尤其是在GPU之间的通信方面。在MoE模型中,对于任何给定的令牌,只有一部分专家处于活动状态,因此在设备之间高效交换数据至关重要。传统的全对全通信方法可能会造成瓶颈,从而增加延迟并导致GPU资源利用不足。在对延迟敏感的设置中,例如实时推理,即使是很小的延迟也会影响整体性能。

  专家认为,DeepSeek推出的DeepEP,是一个专为MoE模型和专家并行(EP)设计的通信库。DeepEP解决了在GPU之间调度和聚合令牌所固有的低效率问题。该通信库提供高吞吐量、低延迟的全对全GPU内核(通常称为MoE调度和组合内核),可简化训练和推理过程中的数据交换。值得注意的是,DeepEP支持低精度操作(包括FP8),与DeepSeek-V3论文中详述的技术一致。此版本直接应对了在节点内和节点间环境中扩展MoE架构的挑战。

  DeepEP通过自适应配置进一步提高灵活性。用户可以调整正在使用的SM数量等参数,或设置环境变量来管理流量隔离。低延迟内核目前支持的自适应路由有助于在高负载下均匀分配网络流量,从而提高稳健性。

  芯片需求大增

  据路透社消息,中国企业推出低成本人工智能模型DeepSeek后,显著推高了模型使用的英伟达人工智能芯片在中国市场的需求。路透社引述知情人士的消息说,多家互联网巨头对同款H20芯片的订单激增。

  与此同时,中国医疗保健、教育等领域规模较小的企业也开始采购备有DeepSeek人工智能模型和英伟达H20芯片的服务器。在这之前,只有财力较雄厚的金融和电信领域企业会采购人工智能计算系统。

  报道说,虽然美国政府探讨进一步收紧对华出口芯片的限制,可能导致芯片订单激增,但知情人士认为,DeepSeek才是促使订单增加的主要原因。

  其实,除了DeepSeek之外,阿里Qwen团队今日早间在社交媒体宣布发布新推理模型——深度思考(QwQ)。这是在QWQ-MAX-PREVIEW支持下,一个基于Qwen2.5-Max的推理模型。QwQ可同时支持深度思考和联网搜索,并会展示完整的思维链。Qwen团队称,QWQ-MAX官方版本即将发布,同步会发布Android和iOS应用程序,还会发布更小的可在本地设备部署的模型,如QWQ-32B等。

  这些模型的推出,对于算力的需求也将是巨大的。今天,智算龙头公司寒武纪一度大涨近5%,股价突破818元。GPU概念股也再度冲高,北京君正涨逾6%,龙芯中科涨逾3%。

(文章来源:证券时报网)

(原标题:DeepSeek,重大发布!)

(责任编辑:6)

 
 
 
 

网友点击排行

 
  • 基金
  • 财经
  • 股票
  • 基金吧
 
郑重声明:天天基金网发布此信息目的在于传播更多信息,与本网站立场无关。天天基金网不保证该信息(包括但不限于文字、数据及图表)全部或者部分内容的准确性、真实性、完整性、有效性、及时性、原创性等。相关信息并未经过本网站证实,不对您构成任何投资决策建议,据此操作,风险自担。数据来源:东方财富Choice数据。

将天天基金网设为上网首页吗?      将天天基金网添加到收藏夹吗?

关于我们|资质证明|研究中心|联系我们|安全指引|免责条款|隐私条款|风险提示函|意见建议|在线客服|诚聘英才

天天基金客服热线:95021 |客服邮箱:vip@1234567.com.cn|人工服务时间:工作日 7:30-21:30 双休日 9:00-21:30
郑重声明:天天基金系证监会批准的基金销售机构[000000303]。天天基金网所载文章、数据仅供参考,使用前请核实,风险自负。
中国证监会上海监管局网址:www.csrc.gov.cn/pub/shanghai
CopyRight  上海天天基金销售有限公司  2011-现在  沪ICP证:沪B2-20130026  网站备案号:沪ICP备11042629号-1

A
安联基金安信基金
B
博道基金渤海汇金北京京管泰富基金百嘉基金贝莱德基金管理博时基金宝盈基金博远基金
C
长安基金长城基金长城证券财达证券淳厚基金创金合信基金长江证券(上海)资管长盛基金财通基金财通资管诚通证券长信基金财信基金财信证券
D
德邦基金德邦证券资管大成基金东财基金达诚基金东方阿尔法基金东方红资产管理东方基金东莞证券东海基金东海证券东吴基金东吴证券东兴基金东兴证券第一创业东证融汇证券资产管理
F
富安达基金蜂巢基金富达基金(中国)富国基金富荣基金方正富邦基金方正证券
G
光大保德信基金国都证券广发基金广发资产管理国海富兰克林基金国海证券国金基金国联安基金国联基金格林基金国联民生国联证券资产管理国融基金国寿安保基金国泰海通资管国泰基金国投瑞银基金国投证券国投证券资产管理国新国证基金国信资管国信证券国新证券股份工银瑞信基金国元证券
H
华安基金汇安基金华安证券华安证券资产管理汇百川基金华宝基金华宸未来基金华创证券泓德基金华富基金汇丰晋信基金海富通基金宏利基金汇泉基金华润元大基金华商基金惠升基金恒生前海基金华泰柏瑞基金华泰保兴基金红土创新基金汇添富基金红塔红土华泰证券(上海)资产管理华夏基金华西基金华鑫证券合煦智远基金华银基金恒越基金弘毅远方基金
J
嘉合基金金融街证券景顺长城基金嘉实基金九泰基金建信基金江信基金金信基金金鹰基金金元顺安基金交银施罗德基金