当前位置:首页 > Deepseek最新资讯 > 正文内容

AI“以小博大”新标杆:三星开源 TRM 模型,700 万参数、特定任务性能媲美

  IT之家 10 月 10 日消息,科技媒体 venturebeat 于 10 月 8 日发布博文,报道称三星高级 AI 研究院发布了名为微型递归模型(TRM)的开源 AI 模型,仅包含 700 万个参数,不过在数独、迷宫等特定的结构化推理任务上,表现媲美甚至超越了参数量为其 10000 倍的谷歌 Gemini 2.5 Pro 等顶尖大模型。

  该模型仅有 700 万参数,设计理念是极致简化复杂性。在架构方面,摒弃了分层推理模型(HRM)所依赖的双网络协作架构,转而采用一个仅有两层的单一模型。

  其核心机制在于“递归推理”:模型对自身输出的预测进行反复迭代和修正deepseek,每一步都纠正前一步的潜在错误,直至答案收敛稳定。

  TRM 通过这种方式,用迭代计算的深度模拟了庞大网络的复杂推理过程,实现了“以递归替代规模”的目标,从而在不牺牲性能的前提下,大幅降低了计算和内存成本。

  然而,一个重要的前提是,TRM 是专门为解决结构化、可视化的网格类问题(如数独、迷宫和特定解谜任务)而设计的,并非通用的语言聊天模型,它擅长在有明确规则的封闭环境中进行逻辑推理,而非开放式的语言生成。

  TRM 的成功源于其刻意追求的“少即是多”极简主义设计。研究发现,增加模型层数或大小反而会导致在小数据集上出现过拟合,性能下降。其精简的双层结构与递归深度相结合,实现了最佳效果。

  TRM 的代码、训练脚本和数据集目前已在 GitHub 上根据 MIT 许可证完全开源,企业和研究人员均可免费使用、修改和部署,甚至用于商业应用。原文出处:AI“以小博大”新标杆:三星开源 TRM 模型,700 万参数、特定任务性能媲美 Deepseek R1 等万倍大模型,感谢原作者,侵权必删!

标签: deepseek

“AI“以小博大”新标杆:三星开源 TRM 模型,700 万参数、特定任务性能媲美” 的相关文章

DeepSeek新模型让AI成本砍半!长文本处理效率暴增的秘密在这

DeepSeek新模型让AI成本砍半!长文本处理效率暴增的秘密在这

  今天早上七点多,我正刷着牙呢,手机突然弹出一条消息:DeepSeek发布全新V3.2-Exp模型。本来以为又是哪个公司在吹牛皮,结果点开一看,我牙刷差点掉洗手池里——这玩意儿不仅性能更...

中国创新药“DeepSeek”时刻已至,上银医疗健康混合A近一年收益率57.49

中国创新药“DeepSeek”时刻已至,上银医疗健康混合A近一年收益率57.49

  今年以来,A股医药板块在历经三年多深度调整后迎来显著反转,成为震荡市中表现最为亮眼的板块之一。Wind数据显示,截至7月末,中证医疗指数今年以来上涨12.73%,中证创新药30指数同期...

“六小龙”中的 DeepSeek:它能成为 AI 搜索里的 GEO 教父吗?

“六小龙”中的 DeepSeek:它能成为 AI 搜索里的 GEO 教父吗?

  在杭州“六小龙”AI 创业群体中,DeepSeek 突然崛起为大众焦点,被视为新时代 AI 搜索平台的潜在“主宰者”。若 DeepSeek 真成主流推荐 / 搜索引擎入口,那么 GEO...

《时代》公布年度300大发明榜单:宇树科技、DeepSeek、华为、比亚迪上榜

《时代》公布年度300大发明榜单:宇树科技、DeepSeek、华为、比亚迪上榜

  北京时间10月10日,美国《时代》杂志公布了2025年度最佳发明榜单,共有300款产品上榜,其中包括宇树科技、DeepSeek、华为、   自2000年以来,《时代》...

DeepSeek预测:那不勒斯vs卡利亚里!孔蒂军团2-0碾压,德布劳内剑指连斩

DeepSeek预测:那不勒斯vs卡利亚里!孔蒂军团2-0碾压,德布劳内剑指连斩

  北京时间8月31日凌晨,马拉多纳球场将迎来意甲第2轮的重头戏——领头羊那不勒斯坐镇主场迎战中游球队卡利亚里。首轮比赛中deepseek,孔蒂的球队以2-0完胜萨索洛,而卡利亚里则1-1...

寒武纪股价破1200大关创历史新高 DeepSeek适配国产芯片成直接原因

寒武纪股价破1200大关创历史新高 DeepSeek适配国产芯片成直接原因

  今日,寒武纪股价突破1200元!8月单月涨幅100%、市值站上5200亿,成为继贵州茅台之后的A股史上第二只千元股。   寒武纪是中国AI芯片设计领军者,其国内云端训...