微软发布新AI推理模型Phi-4,在AIME 2025跑分超越DeepSeek R1

AI资讯2天前发布 ainav
3 0

近日,微软正式对外发布了Phi-4-reasoning系列推理模型。这款创新性产品通过在Phi-4基础上实施监督微调,并结合o3-mini生成的高质量”可教导”提示数据集进行训练,专为应对复杂的推理任务而设计。

据官方博文中介绍,此次发布的Phi-4-reasoning系列包含三款模型:标准版Phi-4-reasoning、增强版Phi-4-reasoning-plus以及精简版Phi-4-mini-reasoning。这三款模型不仅继承了小型模型的高效特性,在推理能力方面更实现了显著突破。

微软发布新AI推理模型Phi-4,在AIME 2025跑分超越DeepSeek R1

该系列模型采用了推理时间扩展技术,特别擅长处理那些需要多步骤分解和深度思考的复杂任务,在数学推理、智能代理等应用场景中表现尤为突出。其性能已展现出与当前顶尖大型模型相媲美的潜力。

其中,Phi-4-reasoning作为核心产品,拥有140亿参数量,并采用基于监督微调的精进训练方式。通过整合OpenAI o3-mini提供的高质量推理演示数据,充分挖掘额外计算资源的潜力,最终实现了生成完整的推理链条。

微软发布新AI推理模型Phi-4,在AIME 2025跑分超越DeepSeek R1

而Phi-4-reasoning-plus作为增强版,通过引入强化学习机制进一步优化性能,其token使用量较标准版增加1.5倍,从而实现了对推理精度的支持提升。

微软发布新AI推理模型Phi-4,在AIME 2025跑分超越DeepSeek R1

在实际测试中,Phi-4-mini-reasoning以3.8亿参数量,在多项数学基准测试中的表现超越了包括OpenThinker-7B和Llama-3.2-3B-instruct等在内的更大规模模型,并在部分指标上逼近OpenAI o1-mini的水平。

该系列模型不仅适用于学术研究,更在教育辅助、边缘计算等领域展现出广阔的应用前景。其高效的推理能力和卓越的性能表现,为人工智能技术的落地应用提供了新的解决方案。

© 版权声明

相关文章