当前位置:首页 > Deepseek最新资讯 > 正文内容

Deepseek R1 推理实测:4 块英伟达 GB300 能干 16 块 H1

7小时前Deepseek最新资讯19

  IT之家援引博文介绍,CoreWeave 使用 Deepseek R1 推理模型,对比评估英伟达 Blackwell 架构 GB300 NVL72 和上一代 H100 GPU 的差别。归功于英伟达升级架构,增强内存和带宽,测试结果显示,GB300 在仅使用 4 块 GPU 的情况下,即可完成原本需要 16 块 H100 才能运行的任务。

  GB300 NVL72 平台支持高达 37TB 的内存容量(最高可达 40TB),并配备每秒 130TB 的内存带宽。该平台为减少 GPU 间数据分割次数deepseek,采用 4 路并行设计,并通过 NVLink 和 NVSwitch 高速互连提升通信效率。

  CoreWeave 指出,这不仅是 FLOPs 算力的提升,更是系统架构在实际业务场景下的效率跃迁。对于需要运行复杂模型的企业客户,GB300 NVL72 提供了更高的扩展性和更低的延迟,帮助他们更快、更经济地部署和运行 AI 服务。原文出处:Deepseek R1 推理实测:4 块英伟达 GB300 能干 16 块 H100 的活,感谢原作者,侵权必删!

标签: deepseek

“Deepseek R1 推理实测:4 块英伟达 GB300 能干 16 块 H1” 的相关文章

超越DeepSeek-R1,数学形式化准确率飙升至84% 字节南大开源

超越DeepSeek-R1,数学形式化准确率飙升至84% 字节南大开源

  该框架创新性地将评估模型置于核心位置。通过强化学习训练的CriticLeanGPT模型,能像数学专家一样精准判断形式化代码是否贴合原始语义,配合迭代优化机制,让生成的定理证明既符合语法...

144 万、DeepSeek 满血版部署大单

144 万、DeepSeek 满血版部署大单

  成都市城市安全与应急管理研究院发布《2025 年度政府采购意向公告(第 2 批)- Deepseek 满血版运行服务器》。   主要功能或目标:本次采购旨在获取满足...

中国联通于2025世界人工智能大会发布智能热线AICC2.0

中国联通于2025世界人工智能大会发布智能热线AICC2.0

  2025年7月27日,中国联通联合国家发展改革委培训中心、中国科学院自动化研究所,共同主办2025世界人工智能大会“人工智能+”战略领军人才与创新发展论坛,期间重磅发布“中国联通智能热...

涉及下代国产芯片,外媒紧盯DeepSeek新动向

涉及下代国产芯片,外媒紧盯DeepSeek新动向

  据路透社8月21日报道,21日,中国人工智能初创企业深度求索发布其旗舰模型DeepSeek-V3的升级版。该公司表示,新版本采用了一项针对国产芯片而设计的技术,能够实现性能优化,并加快...

接近DeepSeek人士确认:DeepSeek-R2在8月内并无发布计划

接近DeepSeek人士确认:DeepSeek-R2在8月内并无发布计划

  格隆汇8月13日|据腾讯科技,近日市场再度传出深度求索(DeepSeek)下一代大模型DeepSeek-R2的发布消息,预计时间窗口为8月15日至30日。对此deepseek,接近De...

DeepSeek母公司,员工套取上亿元

DeepSeek母公司,员工套取上亿元

  红星资本局8月11日消息,时隔大半年以后,去年11月市场盛传的“幻方量化市场总监李橙涉券商返佣被带走”一事,更多细节被揭开。   近日调查显示,李橙在2018-202...