当前位置：首页 > Deepseek最新资讯 > 正文内容

报道：DeepSeek决定使用华为人工智能芯片训练部分模型

2个月前 (08-30)Deepseek最新资讯160

　　观点网讯：8月29日，据媒体报道，DeepSeek已决定使用华为的人工智能芯片来训练其部分模型，反映其正在减少对英伟达芯片的依赖。

　　DeepSeek方面称，本次升级包含以下主要变化：混合推理架构让一个模型同时支持思考模式与非思考模式；相比DeepSeek-R1-0528，DeepSeek-V3.1-Think能在更短时间内给出答案，让模型拥有更高的思考效率；通过Post-Training优化，让新模型有更强的Agent能力，在工具使用与智能体任务中的表现有较大提升。

　　据悉，DeepSeek-V3.1采用了UE8MO FP8 Scale参数精度，该模型与UE8M0FP8动态范围大，提升稳定性与效率，适配华为昇腾等芯片deepseek。原文出处：报道：DeepSeek决定使用华为人工智能芯片训练部分模型，感谢原作者，侵权必删！

标签: deepseek

返回列表

上一篇：“涨价潮”来袭：DeepSeek领涨，国产大模型告别价格战？

下一篇：全国消费者可来京东领海口龙华3C数码消费券购一加 13等手机立减400元

“报道：DeepSeek决定使用华为人工智能芯片训练部分模型” 的相关文章

国元证券-传媒行业周报：可灵Q2营收超2.5亿，DeepSeek~V3.1 发布

　　周度涨跌情况（2025.8.16-2025.8.22，下同）：传媒行业（申万）上涨5.17%，排名行业第6名，同期沪深300涨4.18%，上证指数涨3.49%，深证成指涨4.57%，创...

R2没等来，DeepSeek V3.1模型发布：价格涨了，智能体能力加强

　　在OpenAI发布GPT-5模型14天后，梁文锋终于出招了，新模型版本DeepSeek-V3.1正式发布。　　本次升级的核心亮点是采用了混合推理架构，允许模型在一个...

DeepSeek V3.1出现“极”字Bug，影响编码流程

　　日前，DeepSeek最新版V3.1被发现存在严重Bug，会在代码生成中随机插入“极/極/extreme”等token，导致代码无法正常编译。这一问题不仅出现在第三方量化部署中，官方全...

中国联通于2025世界人工智能大会发布智能热线AICC2.0

　　2025年7月27日，中国联通联合国家发展改革委培训中心、中国科学院自动化研究所，共同主办2025世界人工智能大会“人工智能+”战略领军人才与创新发展论坛，期间重磅发布“中国联通智能热...

以自主可控人工智能点亮千行百业，科大讯飞亮相2025世界智能产业博览会

　　9月5日，2025世界智能产业博览会（以下简称“智博会”）在重庆开幕。本届智博会由重庆市人民政府和天津市人民政府共同主办，聚焦“人工智能+”和“智能网联新能源汽车”主题，吸引600余家...

人工智能拥抱稀疏化：DeepSeek v3.2-Exp & UCM先后开源助力大

　　DeepSeek于9月29日发布V3.2-Exp最新版本，介绍了其稀疏化技术的应用效果，而同样应用稀疏化技术的华为Unified Cache Manager（简称UCM），也在9月30...