AIGC宇宙 AIGC宇宙

DeepSeek公开致谢腾讯技术团队 助力DeepSeek通信框架提速100%

DeepSeek近日发文公开致谢腾讯技术团队,称其对DeepSeek开源通信框架DeepEP的优化是一项“huge speedup”级别的代码贡献。 此次优化聚焦于在多种网络环境下提升通信性能。 经测试,优化后的DeepEP在RoCE网络环境下性能提升高达100%,在IB(InfiniBand)网络环境下提升约30%,显著增强了通信效率,为AI大模型训练提供了更稳定、高效的底层支撑。

DeepSeek近日发文公开致谢腾讯技术团队,称其对DeepSeek开源通信框架DeepEP的优化是一项“huge speedup”级别的代码贡献。

此次优化聚焦于在多种网络环境下提升通信性能。经测试,优化后的DeepEP在RoCE网络环境下性能提升高达100%,在IB(InfiniBand)网络环境下提升约30%,显著增强了通信效率,为AI大模型训练提供了更稳定、高效的底层支撑。

DeepSeek

腾讯技术团队的这一贡献不仅推动了DeepEP性能的实质飞跃,也为更多企业部署大规模AI训练任务提供了可复用的技术范式。

DeepSeek强调,这一成果不仅源于开源社区的协作精神,更展示了腾讯在底层通信技术上的深厚实力。

如果你需要为这条新闻制作视频脚本或社媒文案,也可以继续告诉我。是否还需要配图推荐?

相关资讯

刚刚,DeepSeek开源MoE训练、推理EP通信库DeepEP,真太Open了!

上周五,DeepSeek 发推说本周将是开源周(OpenSourceWeek),并将连续开源五个软件库。 昨天,他们开源了第一个代码库 ——FlashMLA。 这是一款用于 Hopper GPU 的高效型 MLA 解码核,仅用了 24 小时就达到了接近 8k 的 star 量(详情请参见《刚刚,DeepSeek 开源 FlashMLA,推理加速核心技术,Star 量飞涨中》)。
2/25/2025 11:39:00 AM
机器之心

DeepSeek 致谢腾讯技术团队,DeepEP 开源通信框架性能显著提升

经测试,优化后的通信框架性能在 RoCE 网络环境提升 100%,IB 网络环境提升 30%,为企业开展 AI 大模型训练提供更高效的解决方案。
5/7/2025 7:55:10 PM
汪淼

分析一下EP并行和DeepSeek开源的DeepEP代码

被好几个团队的人追着要渣B来分析一下DeepEP的工作, 公司内外的团队都有...简单的一句话说, 非常棒的工作,很多细节都值得学习. 但是还有一些硬件上的缺陷, 在DeepSeek-V3的论文中提出的建议要结合在一起看就会更清楚了. 我们还是由浅入深来谈谈EP并行, 并进一步分析一下这份出色的工作.
2/27/2025 9:06:34 AM
渣B
  • 1