阿里推出最新推理模型

92 0 0

Qwen3-235B-A22B-Thinking-2507是什么

Qwen3-235B-A22B-Thinking-2507是由阿里巴巴推出的全球领先开源推理模型。该模型采用了创新的稀疏混合专家（MoE）架构，配置了高达2350亿个参数，并采用动态激活机制，在运行时仅调用220亿参数进行处理。其深度结构包含94层Transformer网络和128个专家节点，能够高效应对复杂的推理任务。

作为一款专注于复杂逻辑处理的先进模型，Qwen3-235B-A22B-Thinking-2507具备强大的上下文理解能力，支持最长256K的文本处理窗口。在多项核心能力测试中展现出色性能：数学计算、科学分析、编程能力和逻辑推理均达到顶尖水平。值得注意的是，在AIME25数学评测和LiveCodeBench v6编程基准测试中，该模型超越了现有开源模型，甚至媲美部分商业闭源产品。同时，它在知识问答、创意写作和多语言处理等通用任务领域也实现了显著突破。

得益于Apache 2.0的宽松开源协议，Qwen3-235B-A22B-Thinking-2507允许用户免费商用和研究。开发者可通过QwenChat平台、魔搭社区或Hugging Face获取模型，并以每百万输入token 0.7美元和输出token 8.4美元的价格进行商业部署。