当前位置:首页 > Deepseek最新资讯 > 正文内容

核心模型被曝蒸馏DeepSeek?前女友一纸控诉,曝出欧版OpenAI塌房真相!

11小时前Deepseek最新资讯24

  【新智元导读】曾被誉为「欧洲OpenAI」的Mistral AI,陷入「抄袭」丑闻!在分手小作文中,前员工爆料核心技术是蒸馏DeepSeek,却误导外界称为自主RL成果。

  几天前就有人在X上爆料:Mistral的新模型是直接蒸馏自DeepSeek,而且基准测试结果还被歪曲了。

  这个被视为欧洲版OpenAI「全村希望」的公司,地位就如同中国的DeepSeek一般,如今居然塌房了?

  你早知道Mistral做事不讲道德:把DeepSeek蒸馏后当成自己的模型,使用OpenAI的数据,对外却误导称是RL在发挥作用,但它实际上只是DS3的产物,还歪曲基准测试结果。

  你不仅明知这些,还积极参与其中。当我指出这些问题时,你没有承担任何责任,反而选择无视我、对我冷处理。

  也就是说,这位Mistral离职的女员工,不仅在小作文中曝光了自己和前男友、Mistral同事的感情纠葛,还爆出Mistral套壳DeepSeek的丑闻。

  在「小作文」里,这位Mistral前员工痛诉自己如何接连遭遇上司排挤、伴侣出轨、求职无望,还要靠抗抑郁药物试图让情感生活重回正轨。

  其实早在今年6月,就有一位火眼金睛的AI行内人发现,Mistral Small 3.2写的东西,它怎么这么像DeepSeek呢!

  为了比较Mistral-small-3.2和DeepSeek-v3之间的相似性,这位博主在模型的创意写作输出中,提取了跟人类基线相比最过度呈现的单词和n-gram词组。

  肉眼可见,Mistral-small-3.2和DeepSeek-v3在谱系图中的位置非常接近,从而表明它们的特征是极其相似的。

  比如DeepSeek-R1非常擅长在对话中保持角色的一致性,而Gemini Pro 2.5也是如此,简直惊人的相似。

  而且蒸馏大模型也不简单,DeepSeek蒸馏自己的R1模型就不太成功。Paech本人也表示,其实蒸馏也不算什么大错,现在很多模型都是这么干的。

  大模型会把自己的「经验」(比如语言模式、写作风格)以一种简单的方式传给小模型。小模型通过大量练习,逐渐学会了类似的表现,但用更少的计算资源。

  说到头来,Mistral的问题不在于蒸馏DeepSeek,而在于把模型的进步归功于自家的RL方法,甚至蓄意改变基准测试。

  在今年2月,才成立一年多的Mistral AI已经估值62亿美金,成为法国的骄傲,欧洲的骄傲。

  2023年,这三位来自谷歌DeepMind、Meta的前员工希望打造一家遵循欧洲模式的AI公司——开源、高效、注重隐私。

  在当时,当OpenAI斥资超1亿美金训练GPT-4时deepseek,Mistral仅用2200万美元就打造出了最具竞争力的AI模型。

  甚至马克龙还信誓旦旦表示,法国未来几年将投资1090亿欧元用于建设AI,尽最大努力为包括Mistral在内的公司创造空间。

  在成立仅仅七个月的时间里,Mistral就在两个主要「权重级别」上发布了SOTA开源大语言模型(mistral-7b 和 mixtral)。原文出处:核心模型被曝蒸馏DeepSeek?前女友一纸控诉,曝出欧版OpenAI塌房真相!,感谢原作者,侵权必删!

标签: deepseek

“核心模型被曝蒸馏DeepSeek?前女友一纸控诉,曝出欧版OpenAI塌房真相!” 的相关文章

亚洲杯即将来袭!快来评选你心中中国男篮现役最佳阵容

亚洲杯即将来袭!快来评选你心中中国男篮现役最佳阵容

  中国男篮即将奔赴沙特,征战8月5日开打的男篮亚洲杯。此次出征的队员共有14名,包括胡金秋、胡明轩、赵睿、程帅澎、朱俊龙、赵嘉义、廖三宁、余嘉豪、雷蒙、王俊杰、徐杰、高诗岩、李祥波、张宁...

津门数智跃迁:华为深度携手天津打造中国新质生产力“城市样板”

津门数智跃迁:华为深度携手天津打造中国新质生产力“城市样板”

  2025年上半年,天津所给出的经济“年中成绩单”中,“新质生产力加速形成,即规模以上高技术制造业增加值占比达16.4%,发展含‘新’量、含‘科’量显著增强。”引发业界高度关注。这一亮眼...

Deepseek推荐全国旅游百强区第8名:浙江杭州市西湖区

Deepseek推荐全国旅游百强区第8名:浙江杭州市西湖区

  日前,全国县镇发展研究课题组、天和经济研究所县镇发展研究院联合发布了2024《全国县镇发展报告》,报告评价篇对全国县市以及包含乡村人口的市辖区旅游发展水平进行了综合评价,并发布了天和2...

佳都科技(600728.SH):公司采用“自研垂类模型+DeepSeek通用推理

佳都科技(600728.SH):公司采用“自研垂类模型+DeepSeek通用推理

  自2023年起,公司持续关注DeepSeek大模型技术进展,并将其高效训练与推理技术融入自研的“知行交通大模型”。截至目前,公司已经完成DeepSeek-V3及R1版本的适配验证,并已...

曾结束中国无“芯”历史,老牌芯片公司启动IPO,国产工艺芯片8颗能跑满血版Dee

曾结束中国无“芯”历史,老牌芯片公司启动IPO,国产工艺芯片8颗能跑满血版Dee

  据上市辅导备案报告,中星微技术成立于2007年4月3日,注册资本约5.66亿元,法定代表人为张韵东。公司控股股东系堆龙中星微管理咨询有限公司,持股比例20.24%。...

DeepSeek-R2突传重磅!云计算ETF汇添富(159273)大涨超2%,连

DeepSeek-R2突传重磅!云计算ETF汇添富(159273)大涨超2%,连

  消息面上,Eventbrite平台出售DeepSeek-R2门票,窗口期为8月16日至8月31日,但具体日期尚未官宣。Eventbrite是美国知名在线活动策划服务平台,主营业务为在线...