当前位置:首页 > Deepseek最新资讯 > 正文内容

最新的DeepSeek更新了 有网友对新版R1模型进行了测试

5月28日,DeepSeek在官方交流群中公布,DeepSeek R1模型已完成小版本试升级。用户可在官方网页、APP、小程序测试(打开深度思考),API接口和使用方式保持不变。DeepSeek在开源社区Hugging Face也开源了新版R1模型(R1-0528)。

有网友对新版R1模型进行了测试,并表示Deepseek-R1-0528在竞赛级编程的难度基准LiveCodeBench中的表现几乎与OpenAI的o3模型相当。

社交网络和信息网站City-data.com创始人Lech Mazur在社交媒体上表示,Deepseek-R1-0528在Extended NYT Connections基准测试中比原先的DeepSeek R1有了显著改进,分数从38.6上升到49.8。在Thematic Generation基准测试中,Deepseek-R1-0528也优于DeepSeek R1,分数从1.80变为1.74,该分数越低越好。Thematic Generation基准测试衡量各种大模型如何有效地从一小组正例和反例中推断出一个细分或特定的“主题”(类别/规则),然后在一组具有误导性的候选项中检测出哪一项真正符合该主题。

DeepSeek今年春节期间大火。3月份,DeepSeek V3模型完成小版本升级。新版V3模型借鉴DeepSeek R1模型训练过程中所使用的强化学习技术,大幅提高了在推理类任务上的表现水平,在数学、代码类相关评测集上取得了超过GPT-4.5的得分成绩。在HTML等代码前端任务上,新版V3模型生成的代码可用性更高,视觉效果也更加美观、富有设计感。在中文写作任务方面,新版V3模型基于R1的写作水平进行优化,同时提升中长篇文本创作的内容质量。


“最新的DeepSeek更新了 有网友对新版R1模型进行了测试” 的相关文章

《数势科技黎科峰博士:Agent接入DeepSeek,将帮助企业打通数据应用最后一公里》

《数势科技黎科峰博士:Agent接入DeepSeek,将帮助企业打通数据应用最后一公里》

近日,数势科技创始人兼 CEO 黎科峰博士出席由知名科技媒体InfoQ 策划的 DeepSeek 系列直播系列节目。在直播中,极客邦科技创始人  &CEO 霍太稳对话黎科峰博士,深入探讨了回归...

互联网正在沦为“信息垃圾场”,真的是DeepSeek们的错吗?

互联网正在沦为“信息垃圾场”,真的是DeepSeek们的错吗?

“那是最美好的时代,那是最糟糕的时代;那是智慧的年头,那是愚昧的年头……”一百多年前,狄更斯在《双城记》开篇写下的句子,精准描绘出两次工业革命交替之际希望与危机并存的矛盾局面。如今,在人工智能的浪潮中...

“牵手”DeepSeek,福建监狱开启深度思考时代

“牵手”DeepSeek,福建监狱开启深度思考时代

在国家大力发展新质生产力的背景下福建监狱抢抓AI战略机遇以开展“强基提质 增效赋能”专项行动为契机于2024年初启动AI大模型创新项目试点单位仓山监狱率先完成多轮技术迭代论证在监狱内网部署千亿级参数大...

梁文锋“藏锋”|DeepSeek爆火100天

梁文锋“藏锋”|DeepSeek爆火100天

编者按:自1月20日DeepSeek R1爆火以来,过去100天的大模型世界中,DeepSeek成了当之无愧的顶流明星。DeepSeek不仅展现了中国AI的力量,也在一定程度上影响了世界AI发展的方向...

大厂接入DeepSeek,自己的大模型怎么办?

大厂接入DeepSeek,自己的大模型怎么办?

现在还要没有接入DeepSeek的科技大厂吗?盘点下来,好像还真没有了。从国外的英伟达、亚马逊、微软等头部大厂,到国内的BAT、华为和字节跳动,DeepSeek出圈后不就,但凡叫得上名的科技大厂都做出...

接入DeepSeek!广州开启“AI办照”新时代

接入DeepSeek!广州开启“AI办照”新时代

不懂开办企业办照流程?不知道如何进行电子签名?办理进度如何查询……即日起在广州,想咨询这些办事问题,你只要通过“广州市场主体直通车”小程序,即可开启与AI助手的对话式交互,“即答易懂”!3月18日,记...