当前位置:首页 > Deepseek最新资讯 > 正文内容

被曝蒸馏DeepSeek还造假!欧版OpenAI塌方了

2个月前 (08-14)Deepseek最新资讯205

  Mistral最新模型疑似直接蒸馏自DeepSeek,却对外包装成RL成功案例,并刻意歪曲基准测试结果。

  说到Mistral,这家公司被誉为欧洲版OpenAI,是全球开源明星玩家之一,模型性能一直备受好评。

  结果半年过去,剧情反转:Mistral不仅没跑赢DeepSeek,还被曝“借”了人家的成果。

  就像我们开头提到的,推特博主Sam Peach通过分析模型输出中过度使用的词汇模式(Slop),发现了Mistral-small-3.2与DeepSeek-v3之间令人惊讶的高度相似性。

  这种相似性通常很难通过独立训练偶然出现,所以很可能就是蒸馏(distillation)的结果:

  他先统计了模型在创意写作(creativewriting)的输出中,比人类文本更常出现的词和n-gram(词组)。

  最后把这些高频特征进行层次聚类(hierarchicalclustering),生成了一张“相似性图”。

  通过比较相似性图中模型的远近位置,就可以发现Mistral-small-3.2和DeepSeek-v3在图中非常接近,这就表明了它们的输出模式高度相似。

  最新的爆料则进一步指明,Mistral模型和DeepSeek相似不是巧合,而是可能使用了蒸馏。

  离职员工说,Mistral这样做是在假装自家模型的强化学习有效,这不仅歪曲了基准测试结果,而且误导公众。

  而在上一轮融资中(2024年6月),Mistral完成了一轮由General Catalyst领投的6亿欧元(6.45亿美元)的融资,这使其估值上升至58亿欧元(62亿美元),排名全球第四(美国湾区外排名第一)。

  从公司成立以来,Mistral一直保持开源路线,今年开源的模型就包括轻量级模型Mistral Small和主打编程的Mistral Code等。

  相较于主流的大语言模型,主打开源、小快灵的Mistraldeepseek,在多语言处理和推理能力方面具备相当的竞争力,在大模型市场中占据着独特的地位。

  同时他们也推出了自家聊天机器人LeChat,对标ChatGPT,内置深度研究模式、原生多语言推理和高级图像编辑等功能。

  截至目前,Mistral官方还没有回应,就在昨天他们还发布了新模型Mistral Medium V3.1。原文出处:被曝蒸馏DeepSeek还造假!欧版OpenAI塌方了,感谢原作者,侵权必删!

标签: deepseek

“被曝蒸馏DeepSeek还造假!欧版OpenAI塌方了” 的相关文章

基于Deepseek的银行客户经理实战陪练AI解决方案,日均节省客户1.5小时精

基于Deepseek的银行客户经理实战陪练AI解决方案,日均节省客户1.5小时精

  当前银行客户经理面临培训模式与实际需求脱节的挑战:传统 AI 陪练侧重督促客户经理记忆产品知识、金融专业知识等内容,难以应对真实业务中复杂的客户沟通、需求挖掘及个性化营销场景。...

陈天桥联手清华教授代季峰首发最强开源AI模型项目,全力打造下一个DeepSeek

陈天桥联手清华教授代季峰首发最强开源AI模型项目,全力打造下一个DeepSeek

  国内 AI 领域科学家、清华大学电子工程系副教授代季峰,与创新企业家、慈善家、天桥脑科学研究院创始人陈天桥联手筹备一家致力于打造通用人工智能(AGI)新公司一事,引发广泛关注。...

甜蜜事业“焕”新记

甜蜜事业“焕”新记

  九月的山东潍坊,秋风轻拂,走进奎文区道口婚庆喜铺市场,空气里浮动着淡淡的糖果甜香。韩世喜糖店的店面格外引人注目,阳光透过明亮的玻璃窗,洒在丝绒喜盒与烫金装饰上,泛起一层温暖光泽。店主魏...

数字赋能 智绘普法 ——以“3C工作法”打造汕头烟草普法数字人项目

数字赋能 智绘普法 ——以“3C工作法”打造汕头烟草普法数字人项目

  汕头市烟草专卖局创新 “3C 普法工作法”,以数字人技术为核心,融合多模态 AI、法律知识图谱及 AR/VR 技术,打造潮汕文化特色普法体系。全场景覆盖(Comprehensive)形...

国产AI王者归来!科创人工智能ETF(589520)盘中拉升2.5%!DeepS

国产AI王者归来!科创人工智能ETF(589520)盘中拉升2.5%!DeepS

  。这是时隔4年之后,华为麒麟芯片首次公开展示。此外,余承东宣布鸿蒙5.0系统设备数突破1400万。   iPhone 17发售在即,开源证券指出,随着关税问题落地、苹...

Transformer作者:DeepSeek才有搞头,OpenAI指望不上了

Transformer作者:DeepSeek才有搞头,OpenAI指望不上了

  为了填补这块空白,一路从Google到Adept再到Essential AI三次搬家的Vaswani,今年再度迎来巨大转折点——   可惜好景不长,据BloomBer...