当前位置:首页 > DeepSeek技术交流 > 正文内容

文心大模型X1对上最新版DeepSeek V3,表现谁更好?

4个月前 (03-27)DeepSeek技术交流301

3月26日,在多个公开数据集测评中,百度最新发布的文心大模型X1,在数学、代码、推理等能力上表现优异,超越升级后的DeepSeek-V3-0324。

在数学场景中,GSM8K数据集测试后结果显示,文心X1得分95.6,DeepSeek-V3-0324得分93.6;代码生成层面,HumanEval数据集测试后结果显示,文心X1得分90.9,DeepSeek-V3-0324得分86.6;在知识推理层面,C-Eval数据集测试后结果显示,文心大模型X1得分88.6,DeepSeek-V3-0324得分85.1。

近日,DeepSeek官方宣布V3模型完成小版本升级的消息,包括推理、前端开发、中文写作、中文搜索几个方面的能力优化。

而在不久前,百度正式发布文心大模型X1,具备更强的理解、规划、反思、进化能力。文心X1由百度的慢思考技术发展而来。作为能力更全面的深度思考模型,兼备准确、创意和文采,在中文知识问答、文学创作、文稿写作、日常对话、逻辑推理、复杂计算及工具调用等方面表现尤为出色。

据悉,文心大模型X1即将上线千帆大模型平台,API调用价格为DeepSeek-R1调用价格的50%。


“文心大模型X1对上最新版DeepSeek V3,表现谁更好?” 的相关文章

毕节七星关:DeepSeek赋能“智慧监督”

毕节七星关:DeepSeek赋能“智慧监督”

为推动数字技术深度融入纪检监察各项业务,近日,七星关区纪委监委组织全区纪检监察干部开展DeepSeek应用培训,通过“理论筑基、案例赋能、实操强技”三大主题教学模式,全面提升纪检监察干部运用AI技术强...

AI培训赋能加力!甘肃3000余名公共法律服务工作者接受人工智能专题培训

AI培训赋能加力!甘肃3000余名公共法律服务工作者接受人工智能专题培训

法律服务遇上“大数据”“硬科技”怎么办?3月22日,甘肃省司法厅举办人工智能(Deepseek)助力全省公共法律服务发展专题培训会,积极适应人工智能时代发展新要求,切实提升人工智能(Deepseek)...

DeepSeek被写入市政府工作报告,杭州将支持算法模型企业发展

DeepSeek被写入市政府工作报告,杭州将支持算法模型企业发展

“DeepSeek、通义千问等一批大模型加速发展”——杭州市十四届人大五次会议5月22日开幕,向大会作政府工作报告的市长姚高员在回顾2024年工作时,提及以低成本下的出色表现打破赛道壁垒,震动全球同业...

梁文锋的秘密武器:DeepSeek R2或5月问世,成本仅GPT-4o的2.7%

梁文锋的秘密武器:DeepSeek R2或5月问世,成本仅GPT-4o的2.7%

五月将至,中美科技巨头或将迎来新一轮巅峰对决。先是在4月中旬,OpenAI一口气发布了GPT-4.1 o3、o4 mini系列模型;谷歌则拿出了Gemini 2.5 Flash Preview,一个混...

德国对DeepSeek下手

德国对DeepSeek下手

据路透社报道,德国数据保护专员梅克·坎普27日在一份声明中声称,已要求苹果和谷歌公司从其在德国的应用商店下架中国初创公司自主研发的人工智能(AI)大语言模型“深度求索”(DeepSeek)应用,理由是...

蜜度索骥升级!DeepSeek 全文检索 热搜检索

蜜度索骥升级!DeepSeek 全文检索 热搜检索

5月27日,蜜度旗下多模态与跨模态信息检索平台——蜜度索骥,深度融合DeepSeek-R1满血版,推出“深度检索”功能,该功能涵盖两大核心能力,分别为“全文检索”与“热搜检索”。DeepSeek&am...