当前位置:首页 > Deepseek最新资讯 > 正文内容

DeepSeek -V3.1让国产算力迎新机遇

2个月前 (08-29)Deepseek最新资讯195

  DeepSeek方面称,本次升级包含以下主要变化:混合推理架构让一个模型同时支持思考模式与非思考模式;相比DeepSeek-R1-0528,DeepSeek-V3.1-Think能在更短时间内给出答案,让模型拥有更高的思考效率;通过Post-Training优化,让新模型有更强的Agent能力,在工具使用与智能体任务中的表现有较大提升。

  据悉,官方App与网页端模型已同步升级为DeepSeek-V3.1。用户可以通过“深度思考”按钮,实现思考模式与非思考模式的自由切换。

  就此,速途研究院院长丁道师告诉《中国经营报》记者,这次版本的升级,性能更强大了,更好用了。但核心还不是这些升值,而是针对国产芯片的优化,这个才是重中之重。

  爱分析首席李喆告诉本报记者,V3.1版本融合了大语言模型和推理模型,做了Agent适配和国产芯片适配。整体来看,模型能力本身没有大提升,主要是工程化方面做了很多优化,更适合在模型之上开发各类应用。

  丁道师认为,英伟达芯片不安全了,我们就要开启国产化了,在这个背景下,DeepSeek进行了这次大升级。“所以说要把这些背景全部结合起来看,才能一目了然看到这一次升级的本质,就是说现在我国大模型人工智能产业要实现自主可控,要不被美国的产品卡脖子,我们就需要在模型、芯片、算法等多个层面实现自主突破,这样就能理解此次DeepSeek的升级,以及华为芯片的升级之所以备受关注的原因所在了,这背后是整个国家战略的支撑。”

  据了解,DeepSeek宣布其新一代模型DeepSeek-V3.1采用了UE8MO FP8 Scale参数精度,该模型与UE8M0FP8动态范围大,提升稳定性与效率,适配华为昇腾等芯片,实现“低卡高能”部署,带动全产业链发展。在政策推动下,其与昇腾组合切入关键领域,打破垄断,对国产算力及AI产业发展意义重大。

  根据中研网预测,2025年中国AI算力市场达1200亿元。华西证券表示,DeepSeek-V3.1通过技术迭代带动芯片、服务器和云服务的联动优化。国产算力链条呈现出“外部受阻、内部加速”的格局,标志着中国大模型生态正在进入自主化与规模化并进的新阶段。

  近日,硅谷顶级风投a16z发布了新一期的AI应用百大榜单。ChatGPT依旧稳坐第一,但这个宝座越来越不稳固了。Google的Gemini用户数已经追到它的一半,它俩现在是两大顶级的新一代人工智能平台。

  马斯克的Grok靠着一款二次元虚拟伴侣Ani,硬是从0发展到2000万月活。DeepSeek在今年年初爆火后,月活跃用户出现下降,移动端下降了22%,网页端达到了40%。不过其他国产应用表现继续亮眼,移动端Top 50的应用中,预计有22款是由中国团队开发的应用。

  在前20名里,阿里的夸克、字节的豆包、月之暗面的Kimi同时上榜。其中,Kimi作为新兴创业团队的一款产品,能和ChatGPT、Gemini这些巨头产品同台竞争,已经说明了国内用户对中文大模型的强烈需求。

  “DeepSeek -V3.1的优势是继续降低了token使用量,降低使用成本。性能与效果层面,V3.1和其他基模无显著差异。后续各家基模能力上不会有特别大差别deepseek,大概率都围绕着如何降低使用成本、提升使用体验和输出稳定性方面进行不断优化。新一轮模型价格战要开始了。”李喆说。

  要论2024年国内最风光的AI明星,DeepSeek认第二,可能没人敢认第一。QuestMobile数据显示,去年一季度它的下载量冲到8111万次,相当于每16个中国人就有1人装了其APP,比当年微信刚出朋友圈还火。

  不过,后来有第三方数据显示,DeepSeek用户使用率和官网流量回落。据第一财经报道,360集团创始人周鸿祎对此表示,DeepSeek官网流量下降是因为DeepSeek没有花心思,但现在很多第三方云服务上都有DeepSeek的服务,用了DeepSeek的大模型流量一直很高。在中国,许多公司包括360智能体的基座模型等都使用DeepSeek来改,相当于很多公司的“武器装备”都是DeepSeek提供的。

  比如,Kimi K2就用了MOE架构,总参数1T,激活参数32B。另外,阿里巴巴通义千问发布新版Qwen3系列模型,包括2个MoE模型和6个dense模型,参数量从0.6B到235B。原文出处:DeepSeek -V3.1让国产算力迎新机遇,感谢原作者,侵权必删!

标签: deepseek

“DeepSeek -V3.1让国产算力迎新机遇” 的相关文章

DeepSeek母公司亿元返佣案持续发酵,涉及招商证券

DeepSeek母公司亿元返佣案持续发酵,涉及招商证券

  作为DeepSeek的母公司,幻方量化近年来备受关注。在去年11月,就有消息盛传,称“幻方量化市场总监李橙涉券商返佣被带走”。   据近日报道,李橙在2018—202...

全球十大工程成就发布,DeepSeek、英伟达等上榜

全球十大工程成就发布,DeepSeek、英伟达等上榜

  10月13日,由中国工程院院刊《Engineering》评选的“2025全球十大工程成就”,在“2025年世界工程组织联合会全体大会暨全球工程大会”上正式发布。   ...

DeepSeek率先响应AI标识新规,筑牢技术伦理防线

DeepSeek率先响应AI标识新规,筑牢技术伦理防线

  随着《人工智能生成合成内容标识办法》及配套国家标准于2025年9月1日正式实施,我国AI内容治理进入规范化新阶段。在这场关乎技术伦理与公共安全的制度建设中,DeepSeek公司率先发布...

DeepSeek预测:水晶宫vs利物浦!红军不败金身恐遭终结?萨拉赫PK马特塔引

DeepSeek预测:水晶宫vs利物浦!红军不败金身恐遭终结?萨拉赫PK马特塔引

  英超第6轮焦点战即将在塞尔赫斯特公园打响,目前排名第5的水晶宫(2胜3平0负)将迎战全胜领跑的利物浦(5胜0平0负)。主队本赛季仅丢2球(联赛最少)deepseek,而客队狂轰11球(...

Deepseek推荐全国旅游百强区第49名:安徽合肥市包河区

Deepseek推荐全国旅游百强区第49名:安徽合肥市包河区

  日前,全国县镇发展研究课题组、天和经济研究所县镇发展研究院联合发布了2024《全国县镇发展报告》,报告评价篇对全国县市以及包含乡村人口的市辖区旅游发展水平进行了综合评价,并发布了天和2...

亚马逊云科技在Amazon Bedrock上线Qwen3和DeepSeek-V3

亚马逊云科技在Amazon Bedrock上线Qwen3和DeepSeek-V3

  亚马逊云科技客户现可使用四个Qwen3系列开放权重模型。这些模型具备多步骤工作流规划的能力,可与工具和API集成,并能在单个任务中处理长上下文窗口,其中两个通用模型还提供“思考”和“非...