阿里云推出通义千问QwQ-32B推理模型:以1/20参数媲美DeepSeek R1

AI资讯1周前发布 ainav
10 0

近日,阿里云通义千问团队正式发布了其最新推理模型QwQ-32B。该模型凭借320亿参数量实现了令人瞩目的性能表现,在多个领域测试中展现出与DeepSeek-R1相当的水平。

目前,这一创新模型已在两个顶尖开源平台——Hugging Face(https://huggingface.co/Qwen/QwQ-32B)和ModelScope(https://modelscope.cn/models/Qwen/QwQ-32B)上开放源代码,并采用宽松的Apache 2.0协议授权。用户也可通过访问Qwen Chat(https://chat.qwen.AI/?models=Qwen2.5-Plus)直接体验该模型的功能。

阿里云推出最新通义千问 QwQ-32B 推理模型,仅 1/1 参数量实现顶尖性能

在技术验证阶段,研发团队针对QwQ-32B进行了全面的测试评估。测试涵盖数学推理、编程能力以及通用认知等多个维度,并与包括DeepSeek-R1-Distilled-Qwen-32BDeepSeek-R1-Distilled-Llama-70B等在内的领先模型进行了深入对比。

测试结果显示,QwQ-32B在AIME24数学评测集、LiveCodeBench编程能力评估以及Meta的LiveBench等权威评测中均取得优异成绩。特别是在参数量仅为DeepSeek-R1的1/20的情况下,依然实现了与之相媲美的性能表现,充分展现了其强大的效率和效果平衡能力。

参数量创新低下的同时保持高性能表现

这一突破性进展标志着在大规模强化学习(RL)领域的重要技术革新。通过更高效的算法优化和模型架构设计,QwQ-32B不仅大幅降低了计算资源需求,同时保持了顶尖的性能表现,为人工智能技术的落地应用开辟了新的可能性。

未来,阿里云通义千问团队计划继续深入探索更高效的算法创新,目标是推动人工通用智能(AGI)的发展。这一系列研究成果不仅展现了中国在AI领域的创新能力,也为全球人工智能技术发展贡献了重要力量。

© 版权声明

相关文章