当前位置:首页 > Deepseek应用场景 > 正文内容

DeepSeek昨夜上新!新旧版V3对比实测,代码能力飙升,震惊海外用户

7个月前 (03-26)Deepseek应用场景402

原创 陈骏达 智东西

新版V3都来了,R2和V4还会远吗?

作者 | 陈骏达

编辑 | 漠影

智东西3月25日报道,昨日晚间,DeepSeek在开源平台悄然上线了升级后的DeepSeek-V3模型。新模型的版本号为DeepSeek-V3-0324,模型参数为6850亿,较早期版本的6710亿有小幅增长。不过,DeepSeek尚未放出新版模型的系统卡,我们暂时无法获取关于这款模型的更多信息。

开源地址:https://huggingface.co/deepseek-ai/DeepSeek-V3-0324

同时,DeepSeek也将DeepSeek-V3模型的开源协议更新为与DeepSeek-R1一致的MIT协议,这一协议更为宽松,允许模型蒸馏、商用等行为,给了开发者更多的自主权。

新版DeepSeek-V3上线后,智东西第一时间进行了代码、数学和通用能力等多方面的测试,并关注到广大网友的测试结果。据众多已经体验上这款模型的网友分享,升级后的DeepSeek-V3在代码、数学等方面有明显的性能提升。

一位海外AI博主称,DeepSeek终于能在代码领域和Anthropic的Claude Sonnet 3.5一决高下了。而之前,Claude Sonnet 3.5在程序员圈内拥有极高的声誉,无论诸多模型在代码上的成绩如何变化,程序员依旧更青睐使用Claude系列模型。

在智东西的测试中,新版DeepSeek-V3在网站开发能力、UI设计方面展现出巨大的进步,在输入“设计一个美观的个人博客网站,带有科技感,直接开发成可用网页”的提示词之后,直接获得了如下的网页效果。

新版DeepSeek-V3在2分钟的时间内交付了一个总计400多行代码、设计精良的网站,据其介绍,网站采用了粒子背景动画、赛博朋克UI(霓虹光效、悬浮动画和科技感配色)等设计元素,标题使用打字机动画,按钮具备光波扩散效果。

这一网站还使用了响应式设计,能自动适配手机和桌面设备。

而当旧版DeepSeek-V3获得相同的指令时,其解决方案仅有100多行代码,输出的结果在审美上也不如新版的DeepSeek-V3。

有网友称,这次的“小更新”比预期中的更大,改进显著,尤其是在数学方面。

智东西将之前实测中,曾难倒旧版DeepSeek-V3和DeepSeek-R1的一道数学题交给新版DeepSeek-V3。这次,DeepSeek-V3输出的token与原版DeepSeek-V3总量明显更长,单次输出达到了输出上限,在点击继续生成后,DeepSeek-V3继续思考,但这次的答案依旧是错误的。

不过,从错误的答案中,我们也能观察到一些新的变化,如今的DeepSeek-V3在给出最终答案后,会进行一定程度的反思,并修改自己的解题过程。

而在智东西先前测试的文科类问题上,新版DeepSeek-V3的答案变得更为全面。智东西的测试问题为:“布须曼人喝不喝牛奶?”旧版DeepSeek-V3对这一问题的回答仅有三小段话,信息量不多。

新版DeepSeek-V3采用了更为结构化的回答模式,分析的内容更为全面,补充了更多的背景信息,同时生成的速度依旧比较理想。

这也印证了部分网友总结出来的特点:新版DeepSeek-V3像是V3与R1的结合体,更倾向用长输出解决问题。

新版DeepSeek-V3的发布,也让诸多网友不禁遐想:新版V3都来了,R2和V4还会远吗?


“DeepSeek昨夜上新!新旧版V3对比实测,代码能力飙升,震惊海外用户” 的相关文章

打工人自救指南:3招驯服DeepSeek,变身你的24小时秘书

打工人自救指南:3招驯服DeepSeek,变身你的24小时秘书

被工作逼疯?AI 时代还手动搬砖,你就输啦!凌晨两点半,城市早已沉睡,你的办公室却灯火通明。屏幕的光照在脸上,映出疲惫不堪的神情。Excel 里八百多条数据等待分类标红,PPT 的柱状图莫名出错,钉钉...

时隔3个月再访北京 曝黄仁勋会见DeepSeek创始人梁文锋

时隔3个月再访北京 曝黄仁勋会见DeepSeek创始人梁文锋

快科技4月18日消息,日前,应中国贸促会邀请,英伟达CEO黄仁勋抵达北京,中国贸促会会长任鸿斌与黄仁勋举行会谈。这是黄仁勋时隔3个月再次到访北京,行程备受外界关注。据媒体报道,黄仁勋在北京还见了中国生...

广州算力中心接入DeepSeek可支撑千家企业同时接入 让AI为企业“量身”赋能

广州算力中心接入DeepSeek可支撑千家企业同时接入 让AI为企业“量身”赋能

近日,广州人工智能公共算力中心(以下简称“算力中心”)官宣正式部署接入DeepSeek,成为全国首个率先开放了DeepSeek-R1671B昇腾适配版试用的政务级安全算力中心。算力中心记者了解到,当前...

运营商全面接入DeepSeek意味着什么?

运营商全面接入DeepSeek意味着什么?

《科创板日报》2月12日讯 近日,三大运营商宣布全面接入DeepSeek,给市场带来了一波不小的冲击。中国电信率先成为国内首家实现DeepSeek模型全栈国产化推理服务落地的运营商级云平台;...

人工智能新成员Manus和DeepSeek有何区别

人工智能新成员Manus和DeepSeek有何区别

原标题:人工智能新成员Manus和DeepSeek有何区别?近期,一款既能思考问题又能执行任务的“智能体”AI产品——Manus引发广泛关注,它和其他的AI大模型有什么区别,又能做什么呢?一起来看。记...

接入DeepSeek及豆包大模型 瑞幸咖啡首个AI智能体(1.0版)上线

接入DeepSeek及豆包大模型 瑞幸咖啡首个AI智能体(1.0版)上线

随着AI应用热潮卷向现制饮品行业,消费体验正在加速重构。5月26日,瑞幸咖啡在官方APP和微信小程序正式上线首个AI智能体(1.0版),实现在线“动动嘴就能点咖啡”,为消费者带来更加便捷,且独具个性化...