当前位置：首页 > DeepSeek技术交流 > 正文内容

DeepSeek R2没等来，R1“小升级”发布：思考时间更长，效果如何？

5个月前 (05-29)DeepSeek技术交流417

DeepSeek低调升级，引发科技圈热议。

5月28日，DeepSeek 在官方微信群发布消息称，DeepSeek R1模型已完成“小版本试升级”，欢迎前往官方网页、APP、小程序测试（打开深度思考），API 接口和使用方式保持不变。

不过，澎湃新闻记者查询官方网站等，发现没有对此次更新的详细信息。记者咨询了一位DeepSeek内部人士，对方回复称是“小升级”。

根据Hugging Face，DeepSeek-R1此次开源版本为0528。

从宣传来看，此次升级十分低调，不过，根据网友测评，此次升级可不是简单的“小升级”。

有科技媒体分析称，时隔4个月，DeepSeek-R1完成了超进化，编码能力强到离谱，而且思考时间更长了。据称，新模型基于DeepSeek-V3-0324训练（参数为660B）。在LiveCodeBench基准上，DeepSeek-R1-0528性能几乎与o3-mini（High）和o4-mini（Medium)实力相当，一举超越了Gemini 2.5 Flash。

科技类网站“AIGC开放社区”的评论称，在著名代码测试平台Live CodeBench中显示，其性能可以媲美OpenAI最新的o3模型高版本。也有网友对新版R1的风格进行了测试，几乎和OpenAI的o3差不多。

从社交媒体的反馈来看，网友最为关注的是此次DeepSeek R1更新后的思考时间变长。据测评显示，此次DeepSeek单任务处理时长可达30-60分钟。

此外，有网友通过实验对比了Claude-4-Sonnet与DeepSeek-R1-0528的实际表现。可以看到，DeepSeek-R1生成的代码在模拟物理碰撞方面表现更好。

值得注意的是，此前有传言称，深度求索可能将在5月推出下一代AI大模型DeepSeek-R2。

有报道称，DeepSeek-R2大模型将会采用一种更先进的混合专家模型(MoE)，其结合更加智能的门控网络层(Gating Network)以优化高负载推理任务的性能。

不过，当时有内部人士向记者坦言，该传言真实度不高。从目前的情况分析，DeepSeek或许将用此次R1版本的升级，取代R2版本的推出。

尽管网友评测得出的结论十分惊喜，但是也有业内人士向记者表示，建议理性客观看待，也期待更为权威的测评结果。

在DeepSeek R1发布更新后，远在大洋彼岸的AI巨头英伟达（Nasdaq：NVDA）发布截至4月27日的2026财年第一财季财报，期内实现营收440.62亿美元，同比上涨69%，高于市场预期的432.8亿美元；美国通用会计准则（GAAP）下净利润187.75亿美元，同比上涨26%。在财报电话会上，英伟达CEO黄仁勋再次谈到DeepSeek所引发的市场对于推理模型的关注，以及推理模型会需要更大的算力支持，这将驱动推理算力需求。

澎湃新闻记者范佳来