当前位置:首页 > DeepSeek技术交流 > 正文内容

文心大模型X1对上最新版DeepSeek V3,表现谁更好?

6个月前 (03-27)DeepSeek技术交流390

3月26日,在多个公开数据集测评中,百度最新发布的文心大模型X1,在数学、代码、推理等能力上表现优异,超越升级后的DeepSeek-V3-0324。

在数学场景中,GSM8K数据集测试后结果显示,文心X1得分95.6,DeepSeek-V3-0324得分93.6;代码生成层面,HumanEval数据集测试后结果显示,文心X1得分90.9,DeepSeek-V3-0324得分86.6;在知识推理层面,C-Eval数据集测试后结果显示,文心大模型X1得分88.6,DeepSeek-V3-0324得分85.1。

近日,DeepSeek官方宣布V3模型完成小版本升级的消息,包括推理、前端开发、中文写作、中文搜索几个方面的能力优化。

而在不久前,百度正式发布文心大模型X1,具备更强的理解、规划、反思、进化能力。文心X1由百度的慢思考技术发展而来。作为能力更全面的深度思考模型,兼备准确、创意和文采,在中文知识问答、文学创作、文稿写作、日常对话、逻辑推理、复杂计算及工具调用等方面表现尤为出色。

据悉,文心大模型X1即将上线千帆大模型平台,API调用价格为DeepSeek-R1调用价格的50%。


“文心大模型X1对上最新版DeepSeek V3,表现谁更好?” 的相关文章

普通人如何逃离DeepSeek幻觉陷阱

普通人如何逃离DeepSeek幻觉陷阱

DeepSeek横空出世,我们和人工智能的关系也随之进入新时代。但对于许多人来说,与AI的蜜月期还没有结束,幻觉问题就不合时宜地来预警。近期一条“80后死亡率突破5.2%”的假新闻广为流传,据上海网络...

中国电信浙江公司+DeepSeek开启AI之旅 拥抱智能未来

中国电信浙江公司+DeepSeek开启AI之旅 拥抱智能未来

如今,大模型已成为推动各行业智能化转型的核心驱动力。依托“天翼云”国家级云平台,中国电信浙江公司全面整合DeepSeek开源模型,利用息壤智算一体机-DeepSeek版,为客户提供安全、高效以及本地化...

追觅已接入DeepSeek R1大模型,首款产品2月24日上线

追觅已接入DeepSeek R1大模型,首款产品2月24日上线

2月21日,追觅科技旗下Dreamehome APP已接入DeepSeek-R1大模型,即将于2月24日发布的追觅S50系列扫地机器人也将成为市面上首批搭载DeepSeek-R1的智能清洁类产品。Dr...

中国AI大厂,被Deepseek掀了牌桌之后

中国AI大厂,被Deepseek掀了牌桌之后

本文来自微信公众号:极客公园 (ID:geekpark),作者:连冉,题图来自:AI生成过去几个月,尤其是2025年一季度,国内大厂在AI大模型领域的声量明显低调了不少。最直观的感受就是,发布会明显少...

优刻得携手360布局“DeepSeek一体机+大模型安全+AI应用”合作

优刻得携手360布局“DeepSeek一体机+大模型安全+AI应用”合作

人民财讯3月28日电,近日,优刻得与360集团(简称“360”)达成深度合作,双方将基于优刻得DeepSeek一体机与360大模型安全及纳米AI系列产品,拟推动国产大模型“安全筑基—算力赋能—场景创新...

中国电信新疆公司深挖DeepSeek融合应用 AI加“数”构筑智算服务新高地

中国电信新疆公司深挖DeepSeek融合应用 AI加“数”构筑智算服务新高地

“自从上线AI客服,依托DeepSeek大模型的强大语义理解能力,不仅能快速响应,精准解答,还能俄语、哈萨克语、维吾尔语等多语种对话,办事效率高多了。”霍尔果斯政务平台工作人员说。霍尔果斯市是“一带一...