当前位置:首页 > Deepseek最新资讯 > 正文内容

涉及下代国产芯片,外媒紧盯DeepSeek新动向

5小时前Deepseek最新资讯22

  据路透社8月21日报道,21日,中国人工智能初创企业深度求索发布其旗舰模型DeepSeek-V3的升级版。该公司表示,新版本采用了一项针对国产芯片而设计的技术,能够实现性能优化,并加快处理速度。

  对国产芯片兼容性的关注可能表明deepseek,在北京因华盛顿的出口限制而推动取代美国技术之际,深度求索的人工智能模型将适配中国日益强大的半导体生态系统。

  此前,深度求索发布的Deepseek人工智能模型震惊了科技界,因为其模型能够与美国开放人工智能研究中心(OpenAI)的聊天生成预训练转换器(ChatGPT)等西方模型匹敌,同时提供更低的运营成本。

  在此次升级到DeepSeek-V3.1模型之前,其核心模型近期还进行了两次更新——5月份DeepSeek-R1模型更新和3月份DeepSeek-V3模型更新。

  DeepSeek微信公众号发文称,DeepSeek-V3.1使用了UE8M0 FP8 Scale的参数精度,是针对“即将发布的下一代国产芯片”设计。

  该公司21日在微信公众号上表示,DeepSeek-V3.1的特点之一是混合推理架构:一个模型同时支持思考模式与非思考模式。原文出处:涉及下代国产芯片,外媒紧盯DeepSeek新动向,感谢原作者,侵权必删!

标签: deepseek

“涉及下代国产芯片,外媒紧盯DeepSeek新动向” 的相关文章

OpenAI发布低成本模型 与

OpenAI发布低成本模型 与

  OpenAI周二发布了自2019年推出GPT-2以来首批开放权重语言模型。这两款纯文本模型分别命名为gpt-oss-120b和gpt-oss-20b,旨在为开发者、研究人员和企业提供更...

北电数智WAIC首秀,展示星火·大平台落百业丰硕成果

北电数智WAIC首秀,展示星火·大平台落百业丰硕成果

  召开会议,把握志愿、弹性原则,推动临盆关系和临盆力、上层修建和经济基本、国家管理和社会成长更好相适应,要周全贯彻习新期间中国特色思惟,全会提出,加倍重视革新实效,以匆匆进社会公道允义、...

冗长响应缩减80%,DeepSeek GRPO获得颠覆性改进,微软GFPO问世

冗长响应缩减80%,DeepSeek GRPO获得颠覆性改进,微软GFPO问世

  用过 DeepSeek-R1 等推理模型的人,大概都遇到过这种情况:一个稍微棘手的问题,模型像陷入沉思一样长篇大论地推下去,耗时耗算力,结果却未必靠谱。现在,我们或许有了解决方案。...

外媒:OpenAI发布开源模型与DeepSeek展开竞争

外媒:OpenAI发布开源模型与DeepSeek展开竞争

  中新网8月7日电(记者 张乃月)当地时间5日,OpenAI发布了两款“开放权重”模型GPT-oss-120b和GPT-oss-20b,可以根据用户提示生成文本,但不支持图像或视频。英国...

米兰体育报:邓弗里斯的解约条款今日到期,没有球队报价,他将留在国际米兰。

米兰体育报:邓弗里斯的解约条款今日到期,没有球队报价,他将留在国际米兰。

  这几年转会市场越来越怪,豪门只买小年轻,德转和年龄挂钩比例太大,不过随着大巴黎的夺冠,好像也没什么问题   这几年转会市场越来越怪,豪门只买小年轻...

Deepseek推荐全国旅游百强区第19名:湖南长沙市岳麓区

Deepseek推荐全国旅游百强区第19名:湖南长沙市岳麓区

  日前,全国县镇发展研究课题组、天和经济研究所县镇发展研究院联合发布了2024《全国县镇发展报告》deepseek,报告评价篇对全国县市以及包含乡村人口的市辖区旅游发展水平进行了综合评价...