当前位置:首页 > Deepseek最新资讯 > 正文内容

DeepSeek新消息:DeepSeek发布模型更新——DeepSeek-V3-0324

3个月前 (03-25)Deepseek最新资讯252

3月24日晚,DeepSeek发布了模型更新——DeepSeek-V3-0324。本次更新为DeepSeek V3模型的版本更新,并非市场此前一直期待的DeepSeek-V4或R2。目前,其开源版本已上线Hugging Face。据悉,其开源版本模型体积为6850亿参数。

同日,DeepSeek在其官方交流群宣布称,DeepSeek V3模型已完成小版本升级,欢迎前往官方网页、App、小程序试用体验(关闭深度思考),API接口和使用方式保持不变。


从网友反馈的实测效果来看,V3编码能力已经接近 Claude3.7,数学能力也有提升,能像推理模型一样解题。

此前于2024年12月发布的DeepSeek-V3模型曾以“557.6万美金比肩Claude 3.5效果”的高性价比著称,其多项评测成绩超越了Qwen2.5-72B和Llama-3.1-405B等其他开源模型,并在性能上和世界顶尖的闭源模型GPT-4o以及Claude-3.5-Sonnet不分伯仲。但截至目前,还没有任何关于新版 DeepSeek-V3的能力基准测试榜单出现。


其后,DeepSeek于2025年1月发布了性能比肩OpenAI o1正式版的DeepSeek-R1模型,该模型在后训练阶段大规模使用了强化学习技术,在仅有极少标注数据的情况下,极大提升了模型推理能力。

2025年2月25日,市场上也曾出现DeepSeek-R2模型的发布时间或将提前的消息。路透社称,DeepSeek正在加快推出DeepSeek-R1模型的后续产品DeepSeek-R2。据悉,DeepSeek-R2原计划在5月初发布,但公司现在希望尽早推出。

综合/上海证券报、第一财经微信

来源:经济日报


“DeepSeek新消息:DeepSeek发布模型更新——DeepSeek-V3-0324” 的相关文章

关于DeepSeek的常见误区与真相

关于DeepSeek的常见误区与真相

最近,DeepSeek火得有点不讲道理。从我的朋友圈到国外媒体,从华尔街到硅谷,几乎所有人都在热议这个中国AI新秀。560万美元训练成本、开源大模型、链式推理能力、股市动荡...故事真是越讲越玄乎,热...

豆神教育:公司目前已与DeepSeek达成MIT开源协议,获得DeepSeek的官方本地部署授权

豆神教育:公司目前已与DeepSeek达成MIT开源协议,获得DeepSeek的官方本地部署授权

每经AI快讯,有投资者在投资者互动平台提问:贵公司是否和Deepseep合作?豆神教育(300010.SZ)3月17日在投资者互动平台表示,公司2024年10月正式推出的豆神AI APP接入了包括De...

西安工业大学研究团队发布基于DeepSeek的智能仿真想定新范式

西安工业大学研究团队发布基于DeepSeek的智能仿真想定新范式

【西安工业大学研究团队发布基于DeepSeek的智能仿真想定新范式】财联社5月15日电,西安工业大学傅妍芳教授团队近日通过人工智能实现军事仿真想定的自动生成。传统指挥员48小时的编排,AI能用48秒重...

15家银行集体押注,DeepSeek如何掀起金融AI革命?

15家银行集体押注,DeepSeek如何掀起金融AI革命?

银行业加速布局DeepSeek大模型,仍需解决技术幻觉问题。DeepSeek的开源模式和强大推理分析功能,为银行业的应用场景打开了想象空间。当传统银行遇上科技“新宠”DeepSeek,会碰撞出怎样的火...

中国电信丽水分公司完成Deepseek本地化部署

中国电信丽水分公司完成Deepseek本地化部署

近日,丽水政务云成功部署DeepSeek-R1多版本模型,本次部署的DeepSeek-R1模型在政务外网内,具备14B、32B等多版本模型能力。丽水政府首个DeepSeek大模型应用落地上线,丽水分公...

DeepSeek助力贵阳贵安营商环境再上新台阶

DeepSeek助力贵阳贵安营商环境再上新台阶

3月7日上午,贵阳贵安DeepSeek部署应用新闻发布会举行。贵阳市投资促进局副局长秦军介绍了DeepSeek赋能贵阳贵安招商引资、完善配套服务,优化营商环境的做法和取得成效。贵阳市数智化推进招商引资...