1月14日,面壁智能宣布了一项重大突破:清华大学自然语言处理实验室、中国人民大学与OpenBMB开源社区携手面壁智能,共同研发了AgentCPM-Explore智能体模型。这一创新成果仅需40亿参数量,即可实现大模型在长任务处理能力上的端侧部署,为AI技术的实际应用开辟了新的可能性。
在多个权威评测基准中,包括GAIA、HLE、Browsercomp(含中文版本)、WebWalker、FRAMES、Xbench-DeepResearch以及Seal-0等,AgentCPM-Explore均展现了卓越的参数效率。其性能不仅超越了同规模模型的最佳水平(SOTA),更在面对80亿参数量级别的顶级模型时实现了越级挑战,并与部分300亿以上参数量的闭源大模型达到可比肩的效果。

在Xbench-DeepResearch评测中,AgentCPM-Explore的表现尤为突出。其能力超越了包括OpenAI-o3和Claude-4.5-Sonnet在内的多款闭源大模型,不仅突破了同规模模型的性能瓶颈,更展现出显著优于更高参数量模型的趋势,充分证明了该模型在效率与效果上的双重优势。

此次发布的AgentCPM-Explore不仅限于模型本身的开源,更提供了从基础版本(GAIA 25.24%)进化至优化版本(GAIA 63.90%)的完整代码流程。这种开放共享的态度为研究者和开发者提供了宝贵的参考路径,便于深入理解智能体模型的发展与优化过程。
如需了解更多信息或参与这一开源项目,请访问:
https://github.com/OpenBMB/AgentCPM
© 版权声明
文章版权归作者所有,未经允许请勿转载。