当前位置:首页 > Deepseek最新资讯 > 正文内容

DeepSeek开源第一个用于混合专家模型训练和推理的高效专家并行通信库

5个月前 (02-25)Deepseek最新资讯302

【DeepSeek开源第一个用于混合专家模型训练和推理的高效专家并行通信库】财联社2月25日电,DeepSeek在“开源周”的第二天向公众开源了DeepEP。据介绍,DeepEP是第一个用于MoE(混合专家)模型训练和推理的EP(Expert Parallelism,专家并行)通信库,可以实现高效且优化的全对全通信,支持包括FP8在内的低精度运算,适配现代高性能计算需求。同时,DeepEP针对NVLink到RDMA的非对称带宽转发场景进行了深度优化,不仅提供了高吞吐量,还支持SM(Streaming Multiprocessors)数量控制,兼顾训练和推理任务的高吞吐量表现。对于延迟敏感的推理解码场景,DeepEP还提供了纯RDMA的低延迟内核,支持自适应路由,能实现更灵活的GPU资源控制,满足不同场景需求。

“DeepSeek开源第一个用于混合专家模型训练和推理的高效专家并行通信库” 的相关文章

宸展光电:目前研发的新产品可接入DeepSeek

宸展光电:目前研发的新产品可接入DeepSeek

证券日报网讯 5月7日,宸展光电在投资者互动交流平台上,针对投资者关于DeepSeek技术应用的相关提问,给出了专业且审慎的回应。有投资者关心宸展光电产品接入DeepSeek技术所需的硬件条件,公司明...

凌华峰开启AI新尝试,用好DeepSeek,解决连锁企业实际问题

凌华峰开启AI新尝试,用好DeepSeek,解决连锁企业实际问题

“怎么以最快速度用上DeepSeek?”在这场狂热的AI浪潮中,各行各业都像参加赛跑一样急迫——接入DeepSeek,越快越好!而身处北京的凌华峰通信技术有限公司(以下简称:“凌华峰”)却在思考一件实...

DeepSeek 使用率暴跌超50%,从爆发转向质变才是正道

DeepSeek 使用率暴跌超50%,从爆发转向质变才是正道

DeepSeek 自春节以来虽快速蹿红,一度被称为中国版 ChatGPT,它的爆发代表着一种行业信号——国产开源大模型驶入实用赛道,但目前其市占率从2月中旬的高峰7%下降至4月底的3%,使用率下降超5...

云米烟灶套装:DeepSeek赋能下的智慧厨房革命

云米烟灶套装:DeepSeek赋能下的智慧厨房革命

在智能家居浪潮中,厨房正成为AI技术落地的重要场景。云米科技凭借DeepSeek大模型的深度赋能,将其AI烟灶套装升级为"会思考的厨房指挥官",通过智能交互、主动安全和场景联动三大...

DeepSeek热度持续升温,相关公司获机构密集调研

DeepSeek热度持续升温,相关公司获机构密集调研

近期,DeepSeek大模型的热度不减,吸引了众多机构的关注。数据显示,截至2月24日,近一个月内约有40家与DeepSeek相关的上市公司获得了机构的调研。其中,宇信科技、首都在线、顺网科技等公司的...

专访清华大学教授沈阳:DeepSeek的经济价值可能突破十万亿元

专访清华大学教授沈阳:DeepSeek的经济价值可能突破十万亿元

清华大学新闻与传播学院/清华大学人工智能学院双聘教授沈阳。封面新闻记者 边雪2025年伊始,中国人工智能实验室深度求索(DeepSeek)推出的开源语言模型DeepSeek-R1,以一场技术“地震”撼...