当前位置:首页 > DeepSeek技术交流 > 正文内容

DeepSeek V3升级版发布:编程数学能力接近Claude 3.7

7个月前 (03-25)DeepSeek技术交流488

DeepSeek于24日夜间发布V3模型小版本升级,新版本DeepSeek-V3-0324在模型参数上达到685B,并采用MIT许可证,为用户带来全新体验。该版本重点提升了数学和编程能力,性能接近Claude 3.7 Sonnet,且对用户免费开放使用。

模型架构全面升级

DeepSeek-V3作为专家混合巨头模型,原始参数为671B,每个Token可激活370亿个参数。新版本DeepSeek-V3-0324的模型参数提升至685B,采用多头潜在注意力和DeepSeek MoE技术支持。知识截止日期从2023年12月延长至2024年7月,优化了Function call功能,解决了此前版本的函数调用问题。

编程能力显著提升

在前端编程领域,DeepSeek V3-0324展现出惊人实力。测试显示,其能在3分钟内完成750行电商网站代码,包含动态产品卡片悬停效果和手机端响应式布局等功能。自2024年6月以来,业界普遍认为仅Claude 3.5能够生成优质前端代码,而此次DeepSeek的升级版本终于为Anthropic带来了强劲竞争对手。在数学能力方面,V3-0324也表现出色,成功解答了此前大模型普遍解答错误的数学题目。

开源协议引领行业变革

DeepSeek V3-0324采用MIT许可证,允许用户出于任何目的使用、修改和分发模型,包括商业用途。这一决策获得业内广泛关注,Perplexity CEO阿拉文德认为,DeepSeek的开源策略具有革命性意义。该模型不仅能在AWS和Azure上以极低成本部署,仅需支付服务器费用,还为创业企业提供了可负担的AI解决方案。这种开源模式可能影响未来AI巨头的融资格局,推动行业向更开放、更透明的方向发展。

本文源自:金融界


“DeepSeek V3升级版发布:编程数学能力接近Claude 3.7” 的相关文章

艾美疫苗全面接入DeepSeek大模型

艾美疫苗全面接入DeepSeek大模型

2月23日晚,港股公司艾美疫苗(06660.HK)发布自愿公告,全面部署接入DeepSeek大模型,通过本地化策略,推动DeepSeek-R1版本在集团全业务场景应用,实现疫苗全生命周期的“降本、提质...

潮评丨“DeepSeek首次用于地震国际救援”,带给我们三重启示

潮评丨“DeepSeek首次用于地震国际救援”,带给我们三重启示

潮新闻客户端 评论员 王彬图源:央视新闻今天,话题#DeepSeek7小时攻克缅甸救灾语言关#登上热搜榜,引发网友关注。咋回事呢?近日发生的缅甸7.9级地震,灾情牵动人心。在救援行动中,一项由中国团队...

DeepSeek炒股,靠不靠谱?

DeepSeek炒股,靠不靠谱?

“当没有足够信息的时候,大模型会根据用户要求,自己‘脑补’信息,作出回答,并非基于真实世界的逻辑和事实。”文 / 巴九灵最近小巴在后台看到一条留言:“我今年60多岁了,想用DeepSeek来帮我炒股,...

浙商银行:已部署DeepSeek并落地多场景应用

浙商银行:已部署DeepSeek并落地多场景应用

上证报中国证券网讯(记者 黄坤)4月17日,上证报记者从投资者互动平台获悉,有投资人向浙商银行提问:贵公司是否已经部署了DeepSeek?浙商银行回应称,该行当前已部署DeepSeek并落地多场景应用...

DeepSeek实战技巧:最强使用攻略,100个精品提示词

DeepSeek实战技巧:最强使用攻略,100个精品提示词

掌握 DeepSeek 这招,1000 神级提示词带你秒变 AI 高手想成为 AI 领域的佼佼者吗?这里有一份 DeepSeek 实战技巧大礼包!涵盖从新手入门到高手进阶的全方位教程,揭秘 99% 的...

科技平权与文化普惠的时代浪潮,DeepSeek与珠江桥牌的时代共鸣

科技平权与文化普惠的时代浪潮,DeepSeek与珠江桥牌的时代共鸣

当国产AI公司DeepSeek以技术普惠的雄姿风靡全球科技圈之际,珠江桥牌提出一酱做成广东招牌菜的新式产品,巧妙地化解着现代生活的种种困境。就像美国博主“吃货老外铁蛋儿”,他用一口地道的大连方言,生动...