当前位置:首页 > DeepSeek技术交流 > 正文内容

全国高校首个!东南大学继DeepSeek又上线QwQ-32B

3个月前 (03-09)DeepSeek技术交流215

本文转自【新华日报】;

近日

东大基于昇腾国产算力平台

正式接入阿里最新开源模型QwQ-32B

成为全国首个上线QwQ-32B服务的高校

国产算力基座+头部大模型双轨融合

将为教学科研注入更强的AI动能

QwQ-32B:DeepSeek-R1的超强平替

性能比肩顶级模型

QwQ-32B虽仅有32B参数,但通过大规模强化学习训练,在数学推理(AIME24评测)、代码生成(LiveCodeBench)、工具调用(BFCL测试)等任务中表现媲美671B参数的DeepSeek-R1,甚至部分指标实现超越。

上图展示了 QwQ-32B 与其他领先模型在数学推理(AIME24评测)、代码生成(LiveCodeBench)、工具调用(BFCL测试)中的性能对比,QwQ-32B 表现与 DeepSeek-R1 相当,远胜于 o1-mini 及相同尺寸的 R1 蒸馏模型。

低成本、易部署

模型支持消费级显卡本地部署,大幅降低硬件门槛,适配昇腾平台的高效算力资源,助力师生在科研中快速实现AI推理需求。

智能体能力革新

集成工具调用与动态推理能力,模型可根据环境反馈调整策略,适用于复杂任务处理,如数据分析、实验模拟等科研场景。

来源:东南大学微信公众号


“全国高校首个!东南大学继DeepSeek又上线QwQ-32B” 的相关文章

DeepSeek炒股的流量狂欢:博主养号,券商揽客

DeepSeek炒股的流量狂欢:博主养号,券商揽客

博主分享的DeepSeek炒股内容。截图“昨晚让DeepSeek(深度求索)给我推荐两个股票,今天全涨停了!!”最近,DeepSeek的热风,还是吹到了炒股圈。新京报贝壳财经记者调查发现,DeepSe...

中国AIGC应用全景图谱公布:DeepSeek、字节、腾讯、美图产品入选

中国AIGC应用全景图谱公布:DeepSeek、字节、腾讯、美图产品入选

4月16日,量子位智库发布2025中国AIGC应用全景图谱,呈现中国AIGC应用现状及趋势,图谱中既有字节、腾讯等头部大厂,也有DeepSeek这样的行业冠军。作为近两年的明星AI公司,美图公司旗下多...

DeepSeek开源第一个用于混合专家模型训练和推理的高效专家并行通信库

DeepSeek开源第一个用于混合专家模型训练和推理的高效专家并行通信库

【DeepSeek开源第一个用于混合专家模型训练和推理的高效专家并行通信库】财联社2月25日电,DeepSeek在“开源周”的第二天向公众开源了DeepEP。据介绍,DeepEP是第一个用于MoE(混...

“AI公务员”来了?济南这里上线DeepSeek

“AI公务员”来了?济南这里上线DeepSeek

近日,深圳市福田区宣布已成功上线基于DeepSeek技术开发的70名“数智员工”,全面覆盖政务服务全链条。这意味着首批“AI公务员”正式上岗,政务智能化转型迈出了重要一步。近日,山东首个全国产芯“满血...

“调用量太大,经常造成网络拥堵”!DeepSeek推出新优惠,普通用户依然免费

“调用量太大,经常造成网络拥堵”!DeepSeek推出新优惠,普通用户依然免费

中国商报(记者 赵熠如)2月26日,DeepSeek宣布推出错峰优惠活动。即日起,北京时间每日00:30至08:30的夜间空闲时段,API(应用程序编程接口,通常用于应用开发)调用价格大幅下调:Dee...

硅基流动:全面支持基于昇腾算力的DeepSeek-R1&V3私有化集群部署

硅基流动:全面支持基于昇腾算力的DeepSeek-R1&V3私有化集群部署

【硅基流动:全面支持基于昇腾算力的DeepSeek-R1&V3私有化集群部署】财联社2月15日电,硅基流动联合北京昇腾人工智能计算中心,支持基于昇腾算力的 DeepSeek-R1 &...