当前位置:首页 > DeepSeek技术交流 > 正文内容

PPIO 上线 DeepSeek-Prover-V2-671B

2个月前 (05-03)DeepSeek技术交流173

4月30日,DeepSeek 在 Hugging Face 开源了 DeepSeek-Prover-V2-671B 新模型。作为一站式 AIGC 云服务平台,PPIO派欧云在第一时间上线了 DeepSeek-Prover-V2-671B !让开发者能低成本快速使用并助力搭建创新场景。

DeepSeek-Prover-V2-671B 是一款基于 671B 参数的 MoE 大模型。 在模型架构上,该模型使用了DeepSeek-V3架构,采用MoE(混合专家)模式,具有61层Transformer层,7168维隐藏层。同时支持超长上下文,最大位置嵌入达163840,使其能处理复杂的数学证明,并且采用了FP8量化,可通过量化技术减小模型大小,提高推理效率。

PPIO 平台 DeepSeek-Prover-V2-671B 模型的基本信息:

价格: 输入: ¥4/百万 tokens,输出: ¥16/百万 tokens

上下文窗口:160k,最大输出 token 数:160k

据了解,PPIO派欧云是致力于为企业及开发者提供高性能的 API 服务,目前已上线 DeepSeek R1/V3、Llama、GLM、Qwen 等系列模型,仅需一行代码即可调用。并且,PPIO 通过 2024 年的实践,已经实现大模型推理的 10 倍 + 降本,实现推理效率与资源使用的动态平衡。


“PPIO 上线 DeepSeek-Prover-V2-671B” 的相关文章

最新!DeepSeek在肇庆部署上线

最新!DeepSeek在肇庆部署上线

近日,从肇庆市政务服务和数据管理局获悉,国产大模型DeepSeek-R1正式在肇庆市政务云部署上线将全面支持肇庆市全域数字化转型工作目标,标志着肇庆市在人工智能产业发展中迈出了坚实的一步。近年来,肇庆...

DeepSeek“落户”新疆,带来了什么?

DeepSeek“落户”新疆,带来了什么?

中新网乌鲁木齐3月25日电 (史玉江)在人工智能的数字化浪潮中,DeepSeek正全面“落户”新疆,在把科技魅力转化为创造力的同时,也悄然改变着人们的生活。“DeepSeek+智慧政务”广泛应用目前在...

董明珠:将基于 DeepSeek 等打造格力智能家居垂类大模型

董明珠:将基于 DeepSeek 等打造格力智能家居垂类大模型

IT之家 3 月 10 日消息,据证券日报昨日晚间报道,格力董明珠透露:“格力电器已成功将自有的多模型框架与 DeepSeek R1 满血版大模型深度融合。”“例如,这一合作成果已经体现在格力电器的语...

山东移动济南分公司与山东第一医科大学合作DeepSeek项目

山东移动济南分公司与山东第一医科大学合作DeepSeek项目

近日,中国移动通信集团山东有限公司济南分公司与山东第一医科大学达成合作,成功落地DeepSeek项目,为学校部署DeepSeek-R1“满血”版大模型,标志着山东移动济南分公司在“AI+教育”领域迈出...

DeepSeek在山东港口日照港落地应用

DeepSeek在山东港口日照港落地应用

在DeepSeek赋能千行百业的浪潮中,港口如何抓住机遇,培育和发展新质生产力?日前,山东港口日照港在私有化部署国产开源大模型DeepSeek R1基础上,上线日照港流动设备智慧运维平台,首次实现De...

DeepSeek“开源周”点燃大模型开闭源之争

DeepSeek“开源周”点燃大模型开闭源之争

本报记者 秦枭 北京报道DeepSeek 近期举办的“开源周”,宛如一颗重磅炸弹,在全球AI领域激起千层浪。然而,DeepSeek“开源周”带来的影响远不止技术层面,它如同导火索,引发了大模型开源与闭...