当前位置:首页 > Deepseek最新资讯 > 正文内容

报道:DeepSeek决定使用华为人工智能芯片训练部分模型

2个月前 (08-30)Deepseek最新资讯160

  观点网讯:8月29日,据媒体报道,DeepSeek已决定使用华为的人工智能芯片来训练其部分模型,反映其正在减少对英伟达芯片的依赖。

  DeepSeek方面称,本次升级包含以下主要变化:混合推理架构让一个模型同时支持思考模式与非思考模式;相比DeepSeek-R1-0528,DeepSeek-V3.1-Think能在更短时间内给出答案,让模型拥有更高的思考效率;通过Post-Training优化,让新模型有更强的Agent能力,在工具使用与智能体任务中的表现有较大提升。

  据悉,DeepSeek-V3.1采用了UE8MO FP8 Scale参数精度,该模型与UE8M0FP8动态范围大,提升稳定性与效率,适配华为昇腾等芯片deepseek。原文出处:报道:DeepSeek决定使用华为人工智能芯片训练部分模型,感谢原作者,侵权必删!

标签: deepseek

“报道:DeepSeek决定使用华为人工智能芯片训练部分模型” 的相关文章

国元证券-传媒行业周报:可灵Q2营收超2.5亿,DeepSeek~V3.1 发布

国元证券-传媒行业周报:可灵Q2营收超2.5亿,DeepSeek~V3.1 发布

  周度涨跌情况(2025.8.16-2025.8.22,下同):传媒行业(申万)上涨5.17%,排名行业第6名,同期沪深300涨4.18%,上证指数涨3.49%,深证成指涨4.57%,创...

R2没等来,DeepSeek V3.1模型发布:价格涨了,智能体能力加强

R2没等来,DeepSeek V3.1模型发布:价格涨了,智能体能力加强

  在OpenAI发布GPT-5模型14天后,梁文锋终于出招了,新模型版本DeepSeek-V3.1正式发布。   本次升级的核心亮点是采用了混合推理架构,允许模型在一个...

DeepSeek V3.1出现“极”字Bug,影响编码流程

DeepSeek V3.1出现“极”字Bug,影响编码流程

  日前,DeepSeek最新版V3.1被发现存在严重Bug,会在代码生成中随机插入“极/極/extreme”等token,导致代码无法正常编译。这一问题不仅出现在第三方量化部署中,官方全...

中国联通于2025世界人工智能大会发布智能热线AICC2.0

中国联通于2025世界人工智能大会发布智能热线AICC2.0

  2025年7月27日,中国联通联合国家发展改革委培训中心、中国科学院自动化研究所,共同主办2025世界人工智能大会“人工智能+”战略领军人才与创新发展论坛,期间重磅发布“中国联通智能热...

以自主可控人工智能点亮千行百业,科大讯飞亮相2025世界智能产业博览会

以自主可控人工智能点亮千行百业,科大讯飞亮相2025世界智能产业博览会

  9月5日,2025世界智能产业博览会(以下简称“智博会”)在重庆开幕。本届智博会由重庆市人民政府和天津市人民政府共同主办,聚焦“人工智能+”和“智能网联新能源汽车”主题,吸引600余家...

人工智能拥抱稀疏化:DeepSeek v3.2-Exp & UCM先后开源助力大

人工智能拥抱稀疏化:DeepSeek v3.2-Exp & UCM先后开源助力大

  DeepSeek于9月29日发布V3.2-Exp最新版本,介绍了其稀疏化技术的应用效果,而同样应用稀疏化技术的华为Unified Cache Manager(简称UCM),也在9月30...