返回       头条新闻_热点资讯_字字头条

DeepSeek致谢腾讯技术团队

2025-05-08

同时,GPU直接“对话”时存在的传输顺序混乱难题,腾讯提出了“QP内时序锁”机制,使得多个GPU间的数据传输能够精准、按顺序完成,即使同时处理1000多个数据传输任务,DeepEP也能自动理顺先后顺序。

在腾讯的技术优化下,DeepEP不仅在RoCE网络实现性能翻倍,反哺到IB(InfiniBand)网络时更使原有通信效率再提升30%。

目前该技术已全面开源,并成功应用于腾讯混元大模型等项目的训练推理,在腾讯星脉与H20服务器构建的高性能环境中,这套方案同样展现出卓越的通用性。

       

最新文章

张冠李戴的安阳特辑:比收费更刺眼的,是节目组的傲慢

热榜

 

阅读10650

素颜、藏袍、眼泪:杨紫在高原上的“卸妆”时刻

娱乐

 

阅读16673

从蚌埠到名古屋:牛春格用4米73写下撑杆跳高“成人礼”

体育

 

阅读11074

“喧宾夺主”还是“顺势而为”?谢娜官宣巡演的台前幕后与争议真相

娱乐

 

阅读12765

换季“红脸”警报:敏感肌的底层逻辑与科学自救

健康

 

阅读16440

冀ICP备2025113244号-2