当前位置:首页 > Deepseek最新资讯 > 正文内容

DeepSeek发布开源周首个成果 可优化英伟达GPU效率

5个月前 (02-24)Deepseek最新资讯260

新京报贝壳财经讯(记者罗亦丹)北京时间2月24日上午,DeepSeek发布了其“开源周”的第一项成果:FlashMLA(直译为快速多头潜在注意力机制)的代码。


据了解,MLA(多头潜在注意力机制)正是DeepSeek降低大模型成本使用的关键技术之一,其可以显著减少大模型训练和推理过程中的内存占用,而FlashMLA则是针对Hopper GPU(一种英伟达GPU架构)开发的高效MLA解码内核,其针对可变长度序列进行了优化,目前已投入了生产,其可以使得H800达到3000GB/s内存,实现580TFLOPS(每秒浮点运算次数)计算性能。


贝壳财经记者注意到,根据此前DeepSeek发布V3大模型时公开的技术文档,该大模型正是使用英伟达的H800芯片训练而成。


上海骊翰科技咨询有限公司发文称,FlashMLA能在不损失模型性能的前提下,将缓存体积压缩至原来的1/4,从而大幅降低显存需求。例如,原始需要存储的100GB中间结果,压缩后仅需25GB,通过开源让企业可以直接使用FlashMLA来优化自家模型。随着FlashMLA的普及,AI推理有望进入千元级硬件跑百亿模型的时代。


“DeepSeek发布开源周首个成果 可优化英伟达GPU效率” 的相关文章

deepseek算命准吗?deepseek能算命吗?

deepseek算命准吗?deepseek能算命吗?

好的,用户现在问的是“deepseek算命准吗”。首先,我需要确定用户到底在问什么。DeepSeek是一个人工智能公司,主要专注于大模型领域,所以这里提到的“算命”可能是指他们的某个产品或者服务。不过...

OPPO发布首台“直播手机”,深度整合DeepSeek

OPPO发布首台“直播手机”,深度整合DeepSeek

5月15日,OPPO在广东珠海正式推出备受瞩目的Reno14系列手机,搭载更AI的ColorOS 15,深度整合DeepSeek大模型,支持全新小布记忆和升级的AI灵感成片。此次OPPO Reno14...

太平资产完成DeepSeek本地化部署

太平资产完成DeepSeek本地化部署

上证报中国证券网讯(记者 何奎)记者近日获悉,太平资产积极响应国家科技创新战略,顺应人工智能时代潮流,成功完成DeepSeek-R1大模型本地化部署,并实现国产化适配。据介绍,通过本地化部署DeepS...

厦大夜校新开DeepSeek课程!还有这些课程……

厦大夜校新开DeepSeek课程!还有这些课程……

厦大老师开讲DeepSeek 智享生活。思明星光夜校揭牌。  厦门大学夜校又上新了!昨晚,厦门大学继续教育学院与共青团厦门市思明区委员会合作框架协议签约仪式暨“思明星光夜校——厦门大学2025年春季夜...

中国多地政务服务系统接入DeepSeek效率大增

中国多地政务服务系统接入DeepSeek效率大增

考消息网2月20日报道据台湾“中央社”2月19日报道,深度求索(DeepSeek)推出低成本且高效的大型语言模型掀起热潮,中国多地相继宣布政务服务系统接入应用,称可以大幅提升工作效率。以往要花一天时间...

DeepSeek 使用率暴跌超50%,从爆发转向质变才是正道

DeepSeek 使用率暴跌超50%,从爆发转向质变才是正道

DeepSeek 自春节以来虽快速蹿红,一度被称为中国版 ChatGPT,它的爆发代表着一种行业信号——国产开源大模型驶入实用赛道,但目前其市占率从2月中旬的高峰7%下降至4月底的3%,使用率下降超5...