LeCun团队发布首个能像程序员一样思考的代码世界模型

AI资讯2个月前发布 ainav
60 0

Meta重磅发布AI新成果:代码世界模型CWM开启编程革命

继在人工智能领域掀起一系列挖人风波后,Meta终于对外公布了其最新的AI研究成果——代码世界模型(Code World Model, CWM)。这一创新性地将世界模型引入代码生成任务的突破性成果,或将为编程领域带来一场革命。

Meta今日正式宣布推出这款名为CWM的大型语言模型。该模型旨在探索如何通过世界模型提升AI在代码生成方面的性能表现。这一技术方向的创新引发了广泛关注。

LeCun团队发布首个能像程序员一样思考的代码世界模型

值得注意的是,Meta的传奇科学家Yann LeCun也在个人社交账号上转发了这一消息,为该技术背书。

创新引领未来:CWM的核心突破

此次发布的CWM模型在代码生成领域实现了重大突破。其核心技术创新在于将世界模型引入这一任务中,为代码生成带来全新思路。

正如Yann LeCun所强调的,CWM的独特之处在于:在生成代码时,模型能够预测即将执行的代码指令可能产生的效果,并据此规划出更符合人类预期的高质量代码。这一机制使代码生成的质量得到了显著提升。

具体而言,当人类编写代码时,我们会在大脑中模拟其部分执行过程。然而,现有主流语言模型却很难做到这一点。CWM通过专门训练一个世界模型来补足这一缺口,从而实现了更加智能的代码生成效果。

为了验证这一猜想,Meta团队进行了大量实验,并在多个基准测试中取得了令人满意的成果。例如,在解决”数数strawberry中有多少个r”的问题时,CWM展示了类似pdb调试器的工作流程:

LeCun团队发布首个能像程序员一样思考的代码世界模型

性能测试:小参数大突破

尽管CWM仅有32B的参数规模,在实际测试中却展现出了超越预期的表现。在SWE-bench Verified基准测试中,其成绩达到了65.8%,虽然略逊于Qwen3-Coder和Kimi-K2-Instruct,但已接近闭源模型Gemini-2.5-Thinking的水平。

除此之外,在其他测试指标中,CWM同样表现不俗:

  • LiveCodeBench:68.6%
  • Math-500:96.6%
  • AIME 2024:76.0%

LeCun团队发布首个能像程序员一样思考的代码世界模型

作为Meta在代码生成领域的概念性验证,CWM的发布标志着该公司在这条技术路线上迈出了重要一步。虽然目前仍处于-demo阶段,但Meta已明确表示:更大的突破还在后面。

Meta的布局与展望

从当前的技术进展来看,CWM已经展现出显著的应用潜力。其在世界模型辅助代码生成方面的探索,不仅为现有技术提供了新的思路,也为未来的研究指明了方向。

本文来自微信公众号:新智元(ID:AI_era)

© 版权声明

相关文章