华为系首款百万级豪车!尊界S800第10000台今日下线 !
...
2025-12-16
今天是DeepSeek开源周第二日,一早,DeepSeek如约就放出了开源代码库DeepEP王炸。
据了解,DeepEP是首个用于 MoE 模型训练和推理的开源 EP 通信库,它填补了MoE模型专用通信工具的空白,为大规模分布式AI训练和实时推理场景提供了更高效的底层支持。
在这里,简单介绍一下DeepEP的技术性能特点:
1、高效通信架构
支持优化的全对全通信模式,实现节点内和节点间的NVLink与RDMA互联,提升数据传输效率
2、多精度与调度优化
原生支持FP8低精度运算调度,降低计算资源消耗。
3、重性能内核
据介绍,高吞吐量内核可适用于训练和推理预填充场景,最大化数据处理能力;
4、低延迟内核
它针对推理解码场景设计,采用纯RDMA通信和自适应路由技术,减少延迟。
5、资源控制与重叠机制
通过灵活的GPU资源控制策略,实现计算与通信过程的高效重叠,避免资源闲置。
6、深度优化场景
针对NVLink到RDMA的非对称带宽转发场景进行专项优化,提升异构网络下的传输性能;
此外,它还支持SM(Streaming Multiprocessors)数量动态控制,平衡不同任务(如训练与推理)的吞吐量需求。


版权声明:本文内容由互联网用户自发贡献,本站不拥有所有权,不承担相关法律责任。如果发现本站有涉嫌抄袭的内容,欢迎发送邮件至 3941001135@qq.com举报,并提供相关证据,一经查实,本站将立刻删除涉嫌侵权内容。
相关文章
热评文章
宾利推出超豪华儿童三轮车 :售价5380元!
日本核污水将排放30年 全球百余家公司已研发“人造海
男孩脚踩兰博基尼炫耀致车损17万 车主再发声:会追责
多地机票跳水!上海飞成都机票降价80%!
2023国庆档票房破26亿:张艺谋电影《坚如磐石》上
曾与林正英、李小龙搭档 著名武打演员孟海去世:终年6