当前位置:首页 > Deepseek最新资讯 > 正文内容

叫板OpenAI,DeepSeek-V3.1正式发布

3小时前Deepseek最新资讯14

  8月21日,DeepSeek 正式发布 V3.1版本,并将其称为“迈向 Agent 时代的*步”。与以往的大模型迭代不同,它*的特征是混合推理架构,一个模型同时支持思考模式与非思考模式。这意味着模型在保持性能稳定的同时,能够根据需求选择是快速给出答案,还是展开更长链路的推理。

  更重要的是,经过思维链压缩训练,新版模型在生成结果时的token数量减少了20%至50%(同前代模型DeepSeek-R1-0528相比),这不仅带来响应速度的提升,也直接降低了使用成本。

  配合128K的上下文扩展和FP8精度推理,V3.1在工程层面强化了吞吐效率与能耗表现,为大规模应用打下基础。

  除了推理效率上的改进,V3.1在智能体能力上的进化尤为关键。官方测试显示,在代码修复和命令行任务等编程智能体场景中,新模型展现出更强的执行力和稳定性,能够在真实环境中完成多轮迭代修正,避免“越改越乱”的问题。

  在复杂搜索任务上,V3.1则展现了更成熟的检索与整合能力,它可以规划搜索步骤、筛选证据并综合多源信息,在高难度的多学科题目测试中,性能已经远超前代模型。

  在商业与生态层面,DeepSeek 选择了“双轨”策略deepseek,一方面继续提供 API 服务,但将于9月6日起调整价格并取消夜间优惠;另一方面,V3.1的Base模型与后训练版本已在Hugging Face和魔搭同步开源。

  值得一提的是,在这一次的官方发布说明中,DeepSeek提到“V3.1使用了 UE8M0 FP8 Scale的参数精度”,更为通俗的说,它设置了一个适配于即将发布的新一代国产芯片的技术规范与设计标准。“建议有部署需求的用户仔细阅读新版说明文档。”而在此之前,国产芯片部署DeepSeek通常会有一定性能减弱,除非再做专门的软件适配。

  本次DeepSeek-V3.1的发布也似有与GPT5对垒的意味,都支持超长上下文,都有更强的复杂任务处理能力,基础模型调用更为灵活,成本更为弹性。原文出处:叫板OpenAI,DeepSeek-V3.1正式发布,感谢原作者,侵权必删!

标签: deepseek

“叫板OpenAI,DeepSeek-V3.1正式发布” 的相关文章

超越DeepSeek-R1,数学形式化准确率飙升至84% 字节南大开源

超越DeepSeek-R1,数学形式化准确率飙升至84% 字节南大开源

  该框架创新性地将评估模型置于核心位置。通过强化学习训练的CriticLeanGPT模型,能像数学专家一样精准判断形式化代码是否贴合原始语义,配合迭代优化机制,让生成的定理证明既符合语法...

维尔茨等球星流失!海纳:德甲越发边缘化 拜仁一直是德国队核心

维尔茨等球星流失!海纳:德甲越发边缘化 拜仁一直是德国队核心

  “当然,顶尖球员转会国外对德甲来说总是一种损失;他们对任何联赛都有益。这就是为什么德甲共同寻找解决方案以保持国际竞争力如此重要。如果我们不解决国际化等议题,我们将面临球星和潜力新星外流...

DeepSeek母公司员工套取上亿元被抓,幻方量化称为个人行为

DeepSeek母公司员工套取上亿元被抓,幻方量化称为个人行为

  近日,国内顶级量化私募机构幻方量化陷入一场牵涉金额高达1.18亿元的返佣案件。此案涉及幻方量化市场总监李橙,时间跨度长达六年。案件曝光后,幻方量化作为大模型DeepSeek的母公司,其...

米兰体育报:邓弗里斯的解约条款今日到期,没有球队报价,他将留在国际米兰。

米兰体育报:邓弗里斯的解约条款今日到期,没有球队报价,他将留在国际米兰。

  这几年转会市场越来越怪,豪门只买小年轻,德转和年龄挂钩比例太大,不过随着大巴黎的夺冠,好像也没什么问题   这几年转会市场越来越怪,豪门只买小年轻...

deepseek显示服务器繁忙有没有什么解决方法?

deepseek显示服务器繁忙有没有什么解决方法?

最近下载的DeepSeek用户,都遇到了服务器繁忙的现象,deepseek显示服务器繁忙有没有什么解决方法?还有下面三种方式可以使用: 1.使用硅基流动API Key+ chatbox ai 在硅...

我觉得塞斯科俱乐部还是会去争取 而且得买

我觉得塞斯科俱乐部还是会去争取 而且得买

  1.韦维尔作为红牛系出来的 在塞斯科流入市场后如果不作为 那就是失职 特别是如果纽卡买了新赛季能进12个球左右 韦维尔就是大失职 作为一个职场人 大家都知道里面的道理...