当前位置:首页 > Deepseek最新资讯 > 正文内容

DeepSeek又得了个第一

6个月前 (02-15)Deepseek最新资讯314

智东西2月14日报道,刚刚,DeepSeek在开源社区Hugging Face上的点赞数跃居第一,获约8730次点赞,这一数字仍在持续上涨。



这是继DeepSeek应用力压ChatGPT登顶美区App Store免费榜、模型在开源社区GitHub上Star数首次超越OpenAI之后,DeepSeek创下的又一个历史时刻,在海外平台再次登顶。


Hugging Face点赞榜单前十名的模型中,都曾在不同节点引爆整个大模型产业。


排名第二的是曾以AI生图“新王”名号横空出世的FLUX.1,由StableDiffusion原班人马成立的黑森林工作室打造,点赞数约8710次。


排名第六的是全球1000名科学家组成BigScience打造的参数高达1760亿个的超大NLP模型BLOOM,第八的是欧洲AI独角兽Mistral AI基于MoE架构的模型Mixtral-8x7B,其余六席被Meta的Llama系列模型和StabilityAI家的模型包揽。


OpenAI的语音转录模型Whisper-large-v3被挤出前十名之列,排名第11,点赞数约3810次。


此外,DeepSeek-V3的排名在第19名,点赞约3810次,超越了微软的Phi-2和谷歌Gemma-7B模型。


Hugging Face点赞数排行榜前30的还有DeepSeek另一款开源的多模态模型Janus-Pro-7B,该模型在使用文本提示的图像生成排行榜中优于OpenAI的 DALL-E 3和Stability AI的Stable Diffusion。



▲开源社区Hugging Face点赞榜(图源:Hugging Face)


DeepSeek V3、DeepSeek R1、Janus-Pro-7B分别于2024年12月26日和今年1月20日、1月28日发布。


DeepSeek V3为DeepSeek自研MoE模型,参数量达到671B,激活参数量37B,在14.8T token上进行了预训练,该模型在多项评测成绩超越了Qwen2.5-72B和Llama-3.1-405B等开源模型,并在性能上和闭源模型GPT-4o以及Claude-3.5-Sonnet比肩。


DeepSeek R1在数学、代码、自然语言推理等任务上,性能比肩OpenAI o1正式版,在开源DeepSeek-R1-Zero和DeepSeek-R1两个660B模型的同时,蒸馏了6个小模型,其中32B和70B模型在多项能力上实现了对标OpenAI o1-mini的效果。


多模态模型Janus-Pro是去年发布的Janus的高级版本,可显著提高多模态理解和视觉生成。


当下,全球已经掀起了从芯片企业、云计算巨头到各路基础设施公司适配、接入DeepSeek的热潮,DeepSeek所展现出的卓越性能与广泛的应用潜力正在逐渐放大。


“DeepSeek又得了个第一” 的相关文章

LMArena模型榜单出炉!DeepSeek-R1编程能力赶超了Claude Opus 4

LMArena模型榜单出炉!DeepSeek-R1编程能力赶超了Claude Opus 4

机器之心报道编辑:杜伟在开源模型领域,DeepSeek 又带来了惊喜。上个月 28 号,DeepSeek 来了波小更新,其 R1 推理模型升级到了最新版本(0528),并公开了模型及权重。这一次,R1...

平凉市成功接入DeepSeek大模型,“萍萍助手”上线运行

平凉市成功接入DeepSeek大模型,“萍萍助手”上线运行

3月6日,平凉市成功接入DeepSeek大模型,在市政府网站、甘肃政务服务网平凉子站、12345热线平台上线“萍萍助手”智能问答功能,赋能数字政府建设,实现智能问答场景应用创新。“萍萍助手”“萍萍助手...

医学博主自嘲“天塌了”:患者查询DeepSeek后“质疑”治疗方案,而且它是对的

医学博主自嘲“天塌了”:患者查询DeepSeek后“质疑”治疗方案,而且它是对的

昨(22)日,广东一名医学博主上网发帖称,自己为病人开出治疗方案,对方查询DeepSeek后称有问题,自己“气得又查了一遍医学指南”,结果发现医学指南更新了,自嘲感觉“天塌了”。DeepSeek真的这...

福建首家接入DeepSeek中医院来了 电信助力开启AI诊疗新时代

福建首家接入DeepSeek中医院来了 电信助力开启AI诊疗新时代

随着智慧医疗建设推进,人工智能技术在医疗领域的应用不断深化,成为提升医疗服务质量与效率的重要抓手。近日,中国电信福建公司充分发挥云网融合与数字技术优势,助力福建省人民医院成为全省首个接入DeepSee...

DeepSeek在水环境监测中的45个应用场景

DeepSeek在水环境监测中的45个应用场景

Deepseek可以写环评、可以做培训、可以搭建知识库。那Deepseek在水环境监测中有哪些应用场景?在这些场景如何发挥他的深度思考的优势?在数据分析应用的三大方向(纵向挖掘、前后贯通、横向关联)可...

deepseek的历史对话记录能保存多久?

deepseek的历史对话记录能保存多久?

deepseek的历史对话记录能保存多久?Deepseek的历史对话记录默认保存时间为180天。您可以在账户的历史记录页面查看和管理这些记录。如果需要长期保存重要对话,建议手动导出并备份。相关问题怎么...