当前位置:首页 > Deepseek最新资讯 > 正文内容

DeepSeek又得了个第一

9个月前 (02-15)Deepseek最新资讯456

智东西2月14日报道,刚刚,DeepSeek在开源社区Hugging Face上的点赞数跃居第一,获约8730次点赞,这一数字仍在持续上涨。



这是继DeepSeek应用力压ChatGPT登顶美区App Store免费榜、模型在开源社区GitHub上Star数首次超越OpenAI之后,DeepSeek创下的又一个历史时刻,在海外平台再次登顶。


Hugging Face点赞榜单前十名的模型中,都曾在不同节点引爆整个大模型产业。


排名第二的是曾以AI生图“新王”名号横空出世的FLUX.1,由StableDiffusion原班人马成立的黑森林工作室打造,点赞数约8710次。


排名第六的是全球1000名科学家组成BigScience打造的参数高达1760亿个的超大NLP模型BLOOM,第八的是欧洲AI独角兽Mistral AI基于MoE架构的模型Mixtral-8x7B,其余六席被Meta的Llama系列模型和StabilityAI家的模型包揽。


OpenAI的语音转录模型Whisper-large-v3被挤出前十名之列,排名第11,点赞数约3810次。


此外,DeepSeek-V3的排名在第19名,点赞约3810次,超越了微软的Phi-2和谷歌Gemma-7B模型。


Hugging Face点赞数排行榜前30的还有DeepSeek另一款开源的多模态模型Janus-Pro-7B,该模型在使用文本提示的图像生成排行榜中优于OpenAI的 DALL-E 3和Stability AI的Stable Diffusion。



▲开源社区Hugging Face点赞榜(图源:Hugging Face)


DeepSeek V3、DeepSeek R1、Janus-Pro-7B分别于2024年12月26日和今年1月20日、1月28日发布。


DeepSeek V3为DeepSeek自研MoE模型,参数量达到671B,激活参数量37B,在14.8T token上进行了预训练,该模型在多项评测成绩超越了Qwen2.5-72B和Llama-3.1-405B等开源模型,并在性能上和闭源模型GPT-4o以及Claude-3.5-Sonnet比肩。


DeepSeek R1在数学、代码、自然语言推理等任务上,性能比肩OpenAI o1正式版,在开源DeepSeek-R1-Zero和DeepSeek-R1两个660B模型的同时,蒸馏了6个小模型,其中32B和70B模型在多项能力上实现了对标OpenAI o1-mini的效果。


多模态模型Janus-Pro是去年发布的Janus的高级版本,可显著提高多模态理解和视觉生成。


当下,全球已经掀起了从芯片企业、云计算巨头到各路基础设施公司适配、接入DeepSeek的热潮,DeepSeek所展现出的卓越性能与广泛的应用潜力正在逐渐放大。


“DeepSeek又得了个第一” 的相关文章

医生自嘲“天塌了”!患者查DeepSeek后质疑治疗方案,而且它对了!

医生自嘲“天塌了”!患者查DeepSeek后质疑治疗方案,而且它对了!

“天都塌了!病人查DeepSeek后质疑我的治疗方案,气得我自己又查了一遍指南,才发现指南更新了……”2月22日,广东一位医学博主“孤芳自赏”的网帖引起网友热议。截至23日14时,该帖获得15.2万的...

AI名家讲堂开讲!人工智能三次飞跃与DeepSeek技术深度解读

AI名家讲堂开讲!人工智能三次飞跃与DeepSeek技术深度解读

近日,中国航天科技集团有限公司四院精心组织开展人工智能与数字思维名家讲堂。讲堂特邀中国大数据应用联盟人工智能专家委员会主任以“人工智能三次飞跃与DeepSeek”为主题,用通俗易懂的语言拆解复杂的机器...

2025全国DeepSeek 数字应用实训营(临沂站)即将开营

2025全国DeepSeek 数字应用实训营(临沂站)即将开营

2025全国DeepSeek数字应用实训营(临沂站)将于4月26日开营。该实训营由临沂市融媒体中心琅琊新闻网主办,已吸引160余名政企媒精英报名。作为临沂首场聚焦AI全场景落地的实训营,深度融合鲁南经...

学习探索DeepSeek技术 赋能青年科技创新 三明青年说在兴业银行三明分行举行

学习探索DeepSeek技术 赋能青年科技创新 三明青年说在兴业银行三明分行举行

2月27日上午,由共青团三明市委、兴业银行三明分行、兴业证券三明分公司等联合举办的“三明青年说”在兴业银行三明分行举行,本次活动以“学习探索DeepSeek技术 赋能青年科技创新”为主题,吸引了团市委...

格尔软件:公司DeepSeek一体机仍处于市场培育阶段

格尔软件:公司DeepSeek一体机仍处于市场培育阶段

人民财讯3月4日电,格尔软件3月4日在互动平台表示,公司基于国产海光芯片的DeepSeek一体机,通过密码技术为本地部署的大模型赋予数字身份,解决本地大模型输出数据的可信问题与责任追溯困难的痛点,实现...

AWE25超前瞻:DeepSeek引爆AI家电,全屋智能转向

AWE25超前瞻:DeepSeek引爆AI家电,全屋智能转向

文 | 雷科技每年的头三个月,都是科技圈最兴奋的时间段。从1月份的CES(国际消费电子展),到3月初的MWC(世界移动通信大会),再到3月下旬的AWE(中国家电及消费电子博览会),每一场科技展会都汇聚...