当前位置:首页 > Deepseek最新资讯 > 正文内容

DeepSeek发布新一代AI模型:推理更强,使用成本降一半

18小时前Deepseek最新资讯27

  中国人工智能开发商 DeepSeek 推出了一款实验性大型语言模型(LLM),号称在训练与推理能力上有显著提升,并能以更低的成本运行。

  总部位于杭州的DeepSeek表示,该模型采用 稀疏注意力(sparse attention) 技术,使得API(应用程序接口)调用价格可降低一半。API是企业和开发者接入AI模型的主要方式,按使用次数或调用量付费。

  DeepSeek在开发者社区 Hugging Face 上发布文章称,这款新模型是其“下一代AI产品线的重要进展”。

  随着国内外竞争日益激烈,中国科技企业正不断升级自研大模型。就在上周,巴巴推出了其迄今规模最大、功能最强的新一代旗舰模型。

  事实上,谷歌与OpenAI等国际巨头早在2019年就探索过稀疏注意力技术。OpenAI当时指出,对于超大规模输入,完整的注意力矩阵计算成本过高deepseek,而“稀疏模式”可通过只关注部分关键输入,大幅提高效率。

  DeepSeek在随新模型发布的论文中介绍称,该模型采用了 “闪电索引器(lightning indexer)” 与 “精细化的token选择机制”,确保注意力计算仅应用于最相关的token。

  值得注意的是,华为云已在周一晚间发文确认,已“快速完成”对 DeepSeek-V3.2-Exp 模型的适配工作。

  目前,DeepSeek的V3.1版本与阿里巴巴的通义千问Qwen3系列,在人工智能分析平台的全球LLM排名中位列中国前两名,仅次于OpenAI、xAI与Anthropic等国际厂商。原文出处:DeepSeek发布新一代AI模型:推理更强,使用成本降一半,感谢原作者,侵权必删!

标签: deepseek

“DeepSeek发布新一代AI模型:推理更强,使用成本降一半” 的相关文章

DeepSeek低调发布3.2版本:曾经的顶流大模型,如今热度减退了?

DeepSeek低调发布3.2版本:曾经的顶流大模型,如今热度减退了?

  前不久,DeepSeek 悄悄更新了全新的V3.1 版本,这次更新全无公告,只在微信群里做了通知,既没有官方预告,也未同步发布基准测试榜单,仅以“v3.1+”这样保守的命名悄然上线。...

浙江大学联合华为发布国内首个基于昇腾千卡算力平台的 DeepSeek-R1-Sa

浙江大学联合华为发布国内首个基于昇腾千卡算力平台的 DeepSeek-R1-Sa

  当前,以大模型为代表的人工智能技术在全球范围内加速演进,其发展水平和应用深度,已然成为衡量国家创新能力和综合国力的关键指标。统计显示,截至 2025 年 1 月,中国市场上共有约 19...

有不法分子伪造 DeepSeek 工牌、营业执照等,在多个平台以“算力租赁”、“

有不法分子伪造 DeepSeek 工牌、营业执照等,在多个平台以“算力租赁”、“

  近期,有不法分子冒充“深度求索”(DeepSeek)官方或在职员工,伪造工牌、营业执照等材料,在多个平台以“算力租赁”deepseek、“股权融资”等名义向用户收取费用实施诈骗。...

DeepSeek竞然算出了一台丰田埃尔法的实际生产成本

DeepSeek竞然算出了一台丰田埃尔法的实际生产成本

  标题:DeepSeek揭秘制造成本?AI算力与汽车工业擦出火花有关DeepSeek竟推算出丰田埃尔法真实成本的传言近期引发关注。多方信源显示,这家以AI服务见长的科技企业未直接参与汽车...

国产AI王者归来!科创人工智能ETF(589520)盘中拉升2.5%!DeepS

国产AI王者归来!科创人工智能ETF(589520)盘中拉升2.5%!DeepS

  。这是时隔4年之后,华为麒麟芯片首次公开展示。此外,余承东宣布鸿蒙5.0系统设备数突破1400万。   iPhone 17发售在即,开源证券指出,随着关税问题落地、苹...

算力大事件!中国算力大会举行,DeepSeek新模型适配下一代国产芯片

算力大事件!中国算力大会举行,DeepSeek新模型适配下一代国产芯片

  我国在用算力中心标准机架达1085万架,智能算力规模达788 EFLOPS,干线400G端口数量大幅增加至14060个,存力总规模超过1680 EB,全国算力中心平均电能利用效率(PU...