当前位置:首页 > Deepseek最新资讯 > 正文内容

DeepSeek发布开源周首个成果 可优化英伟达GPU效率

5个月前 (02-25)Deepseek最新资讯264

新京报贝壳财经讯(记者罗亦丹)北京时间2月24日上午,DeepSeek发布了其“开源周”的第一项成果:FlashMLA(直译为快速多头潜在注意力机制)的代码。

据了解,MLA(多头潜在注意力机制)正是DeepSeek降低大模型成本使用的关键技术之一,其可以显著减少大模型训练和推理过程中的内存占用,而FlashMLA则是针对Hopper GPU(一种英伟达GPU架构)开发的高效MLA解码内核,其针对可变长度序列进行了优化,目前已投入了生产,其可以使得H800达到3000GB/s内存,实现580TFLOPS(每秒浮点运算次数)计算性能。

贝壳财经记者注意到,根据此前DeepSeek发布V3大模型时公开的技术文档,该大模型正是使用英伟达的H800芯片训练而成。

上海骊翰科技咨询有限公司发文称,FlashMLA能在不损失模型性能的前提下,将缓存体积压缩至原来的1/4,从而大幅降低显存需求。例如,原始需要存储的100GB中间结果,压缩后仅需25GB,通过开源让企业可以直接使用FlashMLA来优化自家模型。随着FlashMLA的普及,AI推理有望进入千元级硬件跑百亿模型的时代。


“DeepSeek发布开源周首个成果 可优化英伟达GPU效率” 的相关文章

AI与安全高峰论坛圆满落幕,共探大模型时代安全破局之道

AI与安全高峰论坛圆满落幕,共探大模型时代安全破局之道

引言DeepSeek 的横空出世,标志中国在人工智能领域的重大技术突破,吸引全球的关注。与此同时,飞速发展的人工智能技术为安全行业带来新的思考题:如何利用 AI 赋能安全攻防,如何确保 AI 技术本身...

一心堂:公司已完成DeepSeek-R1在部分场景的接入

一心堂:公司已完成DeepSeek-R1在部分场景的接入

 同花顺(300033)金融研究中心04月29日讯,有投资者向一心堂(002727)提问, 有否考虑线上接入DeepSeek-R1,向业务、员工、加盟商及合作伙伴的智能体,包括提供即时、准确的问答支持...

亚信科技与清华AIR联合发布《DeepSeek赋能自智网络高阶演进评测报告

亚信科技与清华AIR联合发布《DeepSeek赋能自智网络高阶演进评测报告

2025年2月28日,亚信科技与清华大学智能产业研究院(AIR)联合发布《DeepSeek赋能自智网络高阶演进评测报告》中英文版。该报告为通信行业首份系统性评估DeepSeek等基础大模型对自智网络应...

DeepSeek接入个人知识,回答速度飞快,确实可以封神了!

DeepSeek接入个人知识,回答速度飞快,确实可以封神了!

DeepSeek-R1正在引起越来越多人的关注,近来收到很多读者后台留言,虽然无法逐一作答,但是大家的问题我都阅读了。总结来看,大家普遍关心三类DeepSeek接入个人知识的相关问题:1)DeepSe...

DeepSeek炒股的流量狂欢:博主养号,券商揽客

DeepSeek炒股的流量狂欢:博主养号,券商揽客

博主分享的DeepSeek炒股内容。截图“昨晚让DeepSeek(深度求索)给我推荐两个股票,今天全涨停了!!”最近,DeepSeek的热风,还是吹到了炒股圈。新京报贝壳财经记者调查发现,DeepSe...

DeepSeek回应两会走红:嘿嘿,怪不好意思的

DeepSeek回应两会走红:嘿嘿,怪不好意思的

这两天,谁要是不说说DeepSeek,好像就不太时髦了。全国两会期间, DeepSeek太火。从大会发言人、部长们的点赞,到代表委员们的热议,DeepSeek参与掀起的“人工智能+”浪潮席卷而来,中国...