当前位置:首页 > Deepseek最新资讯 > 正文内容

DeepSeek开源周第三日 发布高性能通用矩阵乘法库

5个月前 (02-26)Deepseek最新资讯319

新京报贝壳财经讯(记者罗亦丹)北京时间2月26日,DeepSeek进行了其开源周第三日的发布——DeepGEMM,一个支持密集和MoE(专家混合模型)GEMM(通用矩阵乘法)的FP8 (8位浮点数)GEMM库,为V3/R1训练和推理提供支持。

据了解,通用矩阵乘法是许多高性能计算任务的核心,所以其性能优化也是大模型降本增效的重点。

DeepSeek表示,DeepGEMM在Hopper GPU(一种英伟达GPU架构)上最高可达到1350+FP8TFLOPS(每秒万亿次浮点运算),并且像教程一样简洁,可完全即时编译,其核心逻辑只有约300行代码,且在大多数矩阵尺寸上均优于专家调优的内核,并支持密集布局和两种MoE布局。


标签: DeepSeek

“DeepSeek开源周第三日 发布高性能通用矩阵乘法库” 的相关文章

DeepSeek引发国内AI全产业链共振

DeepSeek引发国内AI全产业链共振

作者丨青风编辑丨六子DeepSeek的冲击波仍然在持续扩散。春节期间DeepSeek登顶中国、美国、德国等全球超100个国家和地区的iOS应用总榜第1,下载量超越ChatGPT;上线20天,日活用户突...

海南机场接入DeepSeek大模型,加速智慧机场建设步伐

海南机场接入DeepSeek大模型,加速智慧机场建设步伐

2月23日,海南机场成功接入DeepSeek人工智能大模型,在智慧民航领域踏出创新重要一步,为其数字化转型添上关键一笔。据悉,此次接入基于私有化架构,融合企业级向量知识库技术,将核心业务数据存储于专属...

汇正财经预测:DeepSeek的出现,有望让AI终端落地

汇正财经预测:DeepSeek的出现,有望让AI终端落地

2025年1月20日,DeepSeek 发布并开源DeepSeek-R1模型,其在极少标注数据下通过强化学习极大提升推理能力,在各项任务上性能比肩OpenAIo1正式版,获英伟达等众多国内外科技巨头支...

钉钉宣布全面接入DeepSeek系列模型

钉钉宣布全面接入DeepSeek系列模型

  2025年2月17日,钉钉正式启动第八届开工节,宣布全面接入DeepSeek系列模型,并推出四大AI礼包,为企业提供“开箱即用”的智能化解决方案,覆盖协同办公、数据处理、应用开发及专属模型定制等领...

神州信息:公司引入国产开源大模型DeepSeek

神州信息:公司引入国产开源大模型DeepSeek

证券日报网讯 神州信息4月21日在互动平台回答投资者提问时表示,作为领先的金融科技企业,公司引入国产开源大模型DeepSeek,成功实现对全栈金融解决方案的智能化迭代升级,通过低成本、高安全的私域环境...

DeepSeek“引爆”博鳌!AI将像水电一样人人可用

DeepSeek“引爆”博鳌!AI将像水电一样人人可用

当时间步入博鳌亚洲论坛2025年年会第二天,这场盛会迎来议程最繁忙的阶段,人工智能毫无悬念地成为中外嘉宾瞩目的“C位”。从现场令人惊叹的科技展示,到分论坛上唇枪舌剑的思想交锋,AI热度持续飙升。有嘉宾...