DeepSeek R2发布延期,技术难题与芯片适配成关键挑战
近日,关于DeepSeek R2模型迟迟未能发布的问题引发了广泛关注。有消息称,在研发过程中,DeepSeek遭遇了一系列技术挑战,尤其是在使用华为昇腾芯片进行训练时出现了持续性难题,最终决定转而采用英伟达芯片用于训练,同时仍保留昇腾芯片用于推理任务。
据了解,华为方面已派遣工程师团队进驻DeepSeek,协助推进基于昇腾平台的模型开发。然而,整体进度并不理想,开发过程中遇到较多障碍,尤其在芯片散热deepseek、平台稳定性、软硬件适配以及芯片间通信速度等方面问题突出。
尽管面临诸多困难,DeepSeek仍与华为保持紧密合作,力求优化模型与昇腾平台的兼容性,以确保推理任务的顺利完成。
除此之外,R2模型迟迟未能面世还有其他原因。据知情人士透露,研发团队已投入大量时间和精力进行高强度开发,但公司创始人对模型当前的表现仍不满足。同时,公司可能还受到算力资源紧张的影响,进一步延缓了模型的发布进程。原文出处:DeepSeek R2发布延期,技术难题与芯片适配成关键挑战,感谢原作者,侵权必删!