当前位置:首页 > Deepseek最新资讯 > 正文内容

DeepSeek发布开源周首个成果 可优化英伟达GPU效率

2个月前 (02-25)Deepseek最新资讯133

新京报贝壳财经讯(记者罗亦丹)北京时间2月24日上午,DeepSeek发布了其“开源周”的第一项成果:FlashMLA(直译为快速多头潜在注意力机制)的代码。

据了解,MLA(多头潜在注意力机制)正是DeepSeek降低大模型成本使用的关键技术之一,其可以显著减少大模型训练和推理过程中的内存占用,而FlashMLA则是针对Hopper GPU(一种英伟达GPU架构)开发的高效MLA解码内核,其针对可变长度序列进行了优化,目前已投入了生产,其可以使得H800达到3000GB/s内存,实现580TFLOPS(每秒浮点运算次数)计算性能。

贝壳财经记者注意到,根据此前DeepSeek发布V3大模型时公开的技术文档,该大模型正是使用英伟达的H800芯片训练而成。

上海骊翰科技咨询有限公司发文称,FlashMLA能在不损失模型性能的前提下,将缓存体积压缩至原来的1/4,从而大幅降低显存需求。例如,原始需要存储的100GB中间结果,压缩后仅需25GB,通过开源让企业可以直接使用FlashMLA来优化自家模型。随着FlashMLA的普及,AI推理有望进入千元级硬件跑百亿模型的时代。


“DeepSeek发布开源周首个成果 可优化英伟达GPU效率” 的相关文章

鑫元基金已完成DeepSeek私有化部署

鑫元基金已完成DeepSeek私有化部署

国内领先的自主可控大模型DeepSeek横空出世,其开源生态吸引了众多开发者和企业的参与,通过在多行业的广泛应用,形成了丰富的应用场景和解决方案。公募基金行业也未缺席,不少基金公司已在尝试部署这一大模...

DeepSeek回应两会走红:嘿嘿,怪不好意思的

DeepSeek回应两会走红:嘿嘿,怪不好意思的

这两天,谁要是不说说DeepSeek,好像就不太时髦了。全国两会期间, DeepSeek太火。从大会发言人、部长们的点赞,到代表委员们的热议,DeepSeek参与掀起的“人工智能+”浪潮席卷而来,中国...

中国电信咸阳分公司助力政务平台成功接入DeepSeek

中国电信咸阳分公司助力政务平台成功接入DeepSeek

2月19日,中国电信咸阳分公司助力“咸企通”平台接入中国电信自有算力适配的DeepSeek大模型,成功打造全省首个基于星辰大模型的AI政策服务的综合性平台。在原有中国电信“星辰大模型”的基础上,“咸企...

拥抱人工智能 DeepSeek应用专题培训会成功举办

拥抱人工智能 DeepSeek应用专题培训会成功举办

3月18日下午,由滨海新区区委区级机关工委、区委网信办、区数据局共同主办,区级机关工会联合会承办的DeepSeek应用专题培训会召开。培训聚焦“人工智能领域前沿技术的认知与DeepSeek操作应用能力...

大江时评:从DeepSeek到Manus,中国AI领域何以“黑马”频出

大江时评:从DeepSeek到Manus,中国AI领域何以“黑马”频出

江山代有才人出。3月6日凌晨,中国AI团队Monica宣布推出全球首款通用型AI智能体产品Manus,引发网络热议和关注。据悉,Manus在GAIA基准测试中取得了SOTA(State-of-the-...

天融信:公司已发布DeepSeek安全智算一体机

天融信:公司已发布DeepSeek安全智算一体机

新京报贝壳财经讯(记者林子)2月28日,面对投资者询问公司日常是否会借助AI技术辅助工作,赛轮轮胎表示,公司积极探索AI等新技术在相关业务领域的应用,目前公司已私有化部署DeepSeek大模型,目前正...