当前位置:首页 > Deepseek应用场景 > 正文内容

德国团队推出DeepSeek-R1T2模型 推理速度提升显著

8小时前Deepseek应用场景23

近日,德国TNG Technology Consulting GmbH团队基于DeepSeek系列模型推出开源混合模型R1T2,其推理速度较DeepSeek R1-0528提升200%,引发AI领域关注。

该模型采用团队提出的“集合专家(AoE)”方法,整合DeepSeek-R1-0528、R1及V3-0324三个父模型的权重张量,在未额外微调的情况下,继承了前者的推理能力、结构化思维及简洁指令特性。据测试,其推理性能达父模型的90%~92%,输出Token量仅为后者的40%,显著降低计算成本。R1T2采用MIT许可协议,已在Hugging Face开放。该模型在数学、编程等结构化任务中表现突出,为企业级应用提供新选择。(潇栋)


“德国团队推出DeepSeek-R1T2模型 推理速度提升显著” 的相关文章

时光基AI×DeepSeek赋能!AI钉铛智造生产ERP破局中小工业管理痛点

时光基AI×DeepSeek赋能!AI钉铛智造生产ERP破局中小工业管理痛点

2025 年人工智能重构全球产业格局的关键节点,中国工业智能化进程迎来里程碑突破。1 月 2 日,红壹科技正式发布自主研发的 **「时光基 AI」工业大模型 **,该系统深度兼容 DeepSeek 基...

腾讯宣布多业务全面接入更新版DeepSeek R1

腾讯宣布多业务全面接入更新版DeepSeek R1

新京报贝壳财经讯(记者罗亦丹)5月29日,腾讯旗下腾讯元宝、ima、搜狗输入法、QQ浏览器、腾讯文档、腾讯地图、腾讯乐享等多款AI应用宣布接入DeepSeek R1-0528,用户在不同产品中,选择D...

争先恐后接入DeepSeek的国产手机,它们的自研大模型怎么办?

争先恐后接入DeepSeek的国产手机,它们的自研大模型怎么办?

只有小米手机、苹果国行还没宣布外接大模型计划。蛇年春节以来,一场名为DeepSeek的大模型“飓风”开始席卷科技界,手机公司堪称其中反映最迅速的行业之一。 2月10日,中兴通讯终端事业部总裁...

DeepSeek爆火之后,“卖铲人” 赚得盆满钵满

DeepSeek爆火之后,“卖铲人” 赚得盆满钵满

国产大模型DeepSeek在2024年底的爆红盛况就不再阐述了,彼时市场目光都聚焦在这家新兴AI公司身上。随着大模型私有化部署需求激增,“卖铲人”们(在热门产业或风潮中,通过为相关产业提供设备、工具或...

DeepSeek暴露中国AI虚火!

DeepSeek暴露中国AI虚火!

2025年初凭借亮眼宣传与免费策略迅速占据市场的国产大模型“DeepSeek(深度求索)”,短短数月间用户反馈急剧转向,暴露其核心技术存在重大隐忧——数据真实性存疑、知识库严重滞后、技术可持续性不足等...

华为WATCH5接入DeepSeek 精准分析运动健康近200项指标

华为WATCH5接入DeepSeek 精准分析运动健康近200项指标

观点网讯:6月3日,华为宣布其最新智能手表华为WATCH5将接入DeepSeek技术,并融合盘古大模型与运动健康专业模型,实现对个人数据和专业知识的精准理解。华为WATCH5通过腕上小艺智能分析功能,...