当前位置:首页 > DeepSeek技术交流 > 正文内容

文心大模型X1对上最新版DeepSeek V3,表现谁更好?

7个月前 (03-27)DeepSeek技术交流465

3月26日,在多个公开数据集测评中,百度最新发布的文心大模型X1,在数学、代码、推理等能力上表现优异,超越升级后的DeepSeek-V3-0324。

在数学场景中,GSM8K数据集测试后结果显示,文心X1得分95.6,DeepSeek-V3-0324得分93.6;代码生成层面,HumanEval数据集测试后结果显示,文心X1得分90.9,DeepSeek-V3-0324得分86.6;在知识推理层面,C-Eval数据集测试后结果显示,文心大模型X1得分88.6,DeepSeek-V3-0324得分85.1。

近日,DeepSeek官方宣布V3模型完成小版本升级的消息,包括推理、前端开发、中文写作、中文搜索几个方面的能力优化。

而在不久前,百度正式发布文心大模型X1,具备更强的理解、规划、反思、进化能力。文心X1由百度的慢思考技术发展而来。作为能力更全面的深度思考模型,兼备准确、创意和文采,在中文知识问答、文学创作、文稿写作、日常对话、逻辑推理、复杂计算及工具调用等方面表现尤为出色。

据悉,文心大模型X1即将上线千帆大模型平台,API调用价格为DeepSeek-R1调用价格的50%。


“文心大模型X1对上最新版DeepSeek V3,表现谁更好?” 的相关文章

梁文锋参与发表回顾性论文:DeepSeek首次揭秘V3模型背后扩展方案

梁文锋参与发表回顾性论文:DeepSeek首次揭秘V3模型背后扩展方案

DeepSeek刚刚发表了一篇名为《深入解读 DeepSeek-V3:AI 架构的扩展挑战与硬件思考》(Insights into DeepSeek-V3: Scaling Challenges an...

天津渤化集团全面完成DeepSeek本地部署

天津渤化集团全面完成DeepSeek本地部署

津滨网讯(记者 战旗)近日,天津渤海化工集团有限责任公司(以下简称“集团”)在数字化转型征程中稳健迈进,成功完成了DeepSeek大模型的本地部署,并引入了智能办公助手。这一举措旨在全方位提升生产效率...

百万年薪!DeepSeek带火AI相关岗位

百万年薪!DeepSeek带火AI相关岗位

2025年春节,中国人工智能大模型DeepSeek在全球引发轰动。DeepSeek的崛起也让相关领域的人才在这个春招季炙手可热。有企业开出百万年薪!据南方日报报道,在2月的深圳市南山区新春大型招聘活动...

外界热议:DeepSeek又变强了!

外界热议:DeepSeek又变强了!

中国人工智能初创公司深度求索(DeepSeek)24日深夜低调上线了DeepSeek-V3的新版本DeepSeek-V3-0324,参数量为6850亿,在代码、数学、推理等多个方面的能力再次显著提升,...

长城汽车新增“DeepSeek概念”

长城汽车新增“DeepSeek概念”

2025年4月18日,长城汽车(601633)新增“DeepSeek概念”。据同花顺数据显示,入选理由是:根据2025年4月17日互动易:DeepSeek demo 已完成上车验证,融入到长城汽车自研...

所有人都在接入DeepSeek,自研大模型还有必要吗?

所有人都在接入DeepSeek,自研大模型还有必要吗?

最近这一段时间,无论是谁都必须要承认一个现实,这就是DeepSeek彻底火遍了全网,这个国产大模型所带来的冲击一点都不比当时ChatGpt推出的时候差,一时间几乎所有人都在接入DeepSeek,似乎如...