德国团队推出DeepSeek-R1T2模型 推理速度提升显著
近日,德国TNG Technology Consulting GmbH团队基于DeepSeek系列模型推出开源混合模型R1T2,其推理速度较DeepSeek R1-0528提升200%,引发AI领域关注。
该模型采用团队提出的“集合专家(AoE)”方法,整合DeepSeek-R1-0528、R1及V3-0324三个父模型的权重张量,在未额外微调的情况下,继承了前者的推理能力、结构化思维及简洁指令特性。据测试,其推理性能达父模型的90%~92%,输出Token量仅为后者的40%,显著降低计算成本。R1T2采用MIT许可协议,已在Hugging Face开放。该模型在数学、编程等结构化任务中表现突出,为企业级应用提供新选择。(潇栋)