微软发布新AI推理模型Phi-4，在AIME 2025跑分超越DeepSeek R1

AI资讯1年前 (2025)发布 ainav

212 0 0

近日，微软正式对外发布了Phi-4-reasoning系列推理模型。这款创新性产品通过在Phi-4基础上实施监督微调，并结合o3-mini生成的高质量”可教导”提示数据集进行训练，专为应对复杂的推理任务而设计。

据官方博文中介绍，此次发布的Phi-4-reasoning系列包含三款模型：标准版Phi-4-reasoning、增强版Phi-4-reasoning-plus以及精简版Phi-4-mini-reasoning。这三款模型不仅继承了小型模型的高效特性，在推理能力方面更实现了显著突破。

该系列模型采用了推理时间扩展技术，特别擅长处理那些需要多步骤分解和深度思考的复杂任务，在数学推理、智能代理等应用场景中表现尤为突出。其性能已展现出与当前顶尖大型模型相媲美的潜力。

其中，Phi-4-reasoning作为核心产品，拥有140亿参数量，并采用基于监督微调的精进训练方式。通过整合OpenAI o3-mini提供的高质量推理演示数据，充分挖掘额外计算资源的潜力，最终实现了生成完整的推理链条。

而Phi-4-reasoning-plus作为增强版，通过引入强化学习机制进一步优化性能，其token使用量较标准版增加1.5倍，从而实现了对推理精度的支持提升。

在实际测试中，Phi-4-mini-reasoning以3.8亿参数量，在多项数学基准测试中的表现超越了包括OpenThinker-7B和Llama-3.2-3B-instruct等在内的更大规模模型，并在部分指标上逼近OpenAI o1-mini的水平。

该系列模型不仅适用于学术研究，更在教育辅助、边缘计算等领域展现出广阔的应用前景。其高效的推理能力和卓越的性能表现，为人工智能技术的落地应用提供了新的解决方案。

文章版权归作者所有，未经允许请勿转载。

ainav

291 0

ainav

213 0

ainav

310 0

ainav

172 0

ainav

264 0

ainav

217 0