当前位置:首页 > Deepseek最新资讯 > 正文内容

全面适配!京东云将DeepSeek推理场景性能提升50%

7个月前 (03-03)Deepseek最新资讯413

央广网北京3月3日消息 在DeepSeek为期五天的“开源周”中,其连续开源的五大核心技术(FlashMLA、DeepEP、DeepGEMM、DualPipe & EPLB、3FS文件系统),惊艳全球。

京东云率先宣布完成对这五项技术的全栈适配,在模型推理效率、算力资源利用率及数据管理等领域实现突破性优化,综合Flash MLA、DeepEP、FP8 GEMM、DualPipe四方面的调优,在DeepSeek推理场景下性能提升50%。

全面适配五大技术,DeepSeek推理场景性能提升50%

作为DeepSeek开源首日的重磅技术,Flash MLA通过动态调度GPU的显存与算力资源,解决了传统方法处理变长序列时的资源浪费问题。

京东vGPU AI算力平台通过支持Flash MLA的FP8格式来提升推理性能,使单Token的 KV Cache显存占用相比Multi-head Attention降低57倍,配合最新的投机推理技术,以极低的显存需求,在高并发请求场景下保证了推理的吞吐量和延迟表现。

此外,针对用于DeepSeek开源的通信库DeepEP,京东云vGPU AI算力平台已全面支持EP模式下的分布式推理,显著提高推理吞吐。通过整合DeepEP作为通信后端,针对机内通信使用NVLink传输数据,机间通信使用NVSHMEM接口走RDMA网络,同时通过灵活的GPU SM数量利用控制,增大GPU算力资源利用率以及减少对计算算子的性能串。

更低成本更高效率,让大模型真正用起来

针对客户大模型的使用需求,京东云vGPU AI算力平台,为用户提供更高推理性能、更多国产芯片适配、更多高数据安全的大模型服务,让大模型真正用起来。

在推理性能方面,针对DeepSeek大模型技术特点,京东云通过推理加速与内核驱动级优化,提升单台服务器推理性能50%。

在国产芯片适配方面,京东云已完成从底层算力到大模型和业务应用的全面国产化适配,包括十余家国产化AI算力,确保自主可控。

在数据安全方面,通过机密容器AI全场景密态计算和先进的容器隔离技术,确保模型数据的机密性与完整性,为用户提供金融级安全防护。

目前,在河南鹤壁、江苏宿迁、山东滨州、广西北海、山西大同,京东云已经助力多地政府基于现有基础设施本地化部署DeepSeek,既满足本地政务业务,又让当地企业不用投入资源,即可通过政务云调用DeepSeek。


标签: DeepSeek

“全面适配!京东云将DeepSeek推理场景性能提升50%” 的相关文章

江西联通深化人工智能赋能 推动DeepSeek多领域融合创新

江西联通深化人工智能赋能 推动DeepSeek多领域融合创新

当下最热的DeepSeek与江西联通携手,将擦出怎样的精彩火花?从政务服务到高校课堂,从纺织车间到产业决策,一场由人工智能驱动的变革正加速重构传统业态。近日,江西联通以DeepSeek大模型为核心,在...

廊坊市委研究室、市委改革办 举办DeepSeek应用专题讲座

廊坊市委研究室、市委改革办 举办DeepSeek应用专题讲座

为落实廊坊市委关于“部署DeepSeek等人工智能底座,打造多元化智慧应用场景”的战略部署,深入推进DeepSeek赋能廊坊政研和改革工作,3月21日下午,市委研究室、市委改革办举办全市政研和改革系统...

DeepSeek引发市场跷跷板!基金经理“忙不停”

DeepSeek引发市场跷跷板!基金经理“忙不停”

“DeepSeek正在引发世界对中国AI产业、中国科技资产,甚至中国整体资产的价值重估。”在接受券商中国记者采访时,一位基金经理满怀激动地讲道。中国AI发展的主流叙事已经逐渐从追赶转向超越,这一认知的...

田间赋诗的沂蒙农民大姐吕玉霞也用过DeepSeek “有人质疑诗是DeepSeek写的 它写的话肯定会更华丽一些”

田间赋诗的沂蒙农民大姐吕玉霞也用过DeepSeek “有人质疑诗是DeepSeek写的 它写的话肯定会更华丽一些”

齐鲁网·闪电新闻3月14日讯 3月14日(采访时间),山东临沂。近日,“70后”农民大姐沂蒙二姐”吕玉霞在田间创作诗歌的视频火了。吕玉霞提到,自己有不懂的字词也会通过DeepSeek学习,但在创作上,...

飞书低代码平台已全面接入Deepseek R1模型能力

飞书低代码平台已全面接入Deepseek R1模型能力

钛媒体App 2月14日消息,飞书低代码平台已全面接入Deepseek R1模型能力。平台提供大量AI增强能力,开发者可在流程中直接调用DeepSeekR1模型,对数据进行批量自动化处理。此外,页面中...

新版DeepSeek-V3接入每经大模型平台!小编亲测:敲代码、写报告、撰长文样样在行

新版DeepSeek-V3接入每经大模型平台!小编亲测:敲代码、写报告、撰长文样样在行

3月24日,DeepSeek悄悄上线了新版V3开源大模型——DeepSeek-V3-0324。专业AI模型评测机构Artificial Analysis最新排名显示,新版DeepSeek-V3在基准测...