业界动态

阿里云Qwen全新推理模型仅1/21参数媲美DeepSeek R1

发布日期：2025-03-06

来源：快科技

3月6日消息，阿里Qwen团队正式发布他们最新的研究成果——QwQ-32B大语言模型。

这是一款拥有320亿参数的模型，其性能可与具备6710亿参数（其中370亿被激活）的DeepSeek-R1媲美。

QwQ-32B在仅有DeepSeek-R1约1/21参数量的情况下，用强化学习实现了性能上的跨越。

此外，阿里还在推理模型中集成了与Agent相关的能力，使其能够在使用工具的同时进行批判性思考，并根据环境反馈调整推理过程。

QwQ-32B 在一系列基准测试中进行了评估，测试了数学推理、编程能力和通用能力。

其中，在测试数学能力的AIME24评测集上，以及评估代码能力的LiveCodeBench中，千问QwQ-32B表现与DeepSeek-R1相当，远胜于o1-mini及相同尺寸的R1 蒸馏模型。

同时，在由Meta首席科学家杨立昆领衔的“最难LLMs评测榜”LiveBench、谷歌等提出的指令遵循能力IFEval评测集、由加州大学伯克利分校等提出的评估准确调用函数或工具方面的BFCL测试中，千问QwQ-32B的得分均超越了DeepSeek- R1。

目前，QwQ-32B已在Hugging Face和ModelScope开源，大家也可通过Qwen Chat直接进行体验！

Magazine.Subscription.jpg

版权声明：本站内容除特别声明的原创文章之外，转载内容只为传递更多信息，并不代表本网站赞同其观点。转载的所有的文章、图片、音/视频文件等资料的版权归版权所有权人所有。本站采用的非本站原创文章及图片等内容无法一一联系确认版权者。如涉及作品内容、版权和其它问题，请及时通过电子邮件或电话通知我们，以便迅速采取适当措施，避免给双方造成不必要的经济损失。联系电话：010-82306116；邮箱：aet@chinaaet.com。

阿里云 Qwen Deepseek

点击进入忆阻器二极管/三极管/场效应管测试专题

点击查看ChinaAET Qorvo QSPICE知识专区

进入了解AET工业互联网专题

欢迎查看AET-ChatGPT专题

点击了解国有企业数字化转型专题