谷歌AlphaEvolve获陶哲轩团队认可，开启大规模数学研究新纪元

198 0 0

11月19日消息，谷歌旗下DeepMind公司开发的人工智能工具在数学研究领域展现出显著优势。经过多位数学家测试，该技术被认为将推动人工智能驱动的数学发现进入规模化的新阶段。

今年5月，谷歌推出了名为AlphaEvolve的人工智能系统。该系统能够自主发现新的算法与数学公式。其工作流程是：首先由AI聊天机器人Gemini生成大量潜在解法；随后，这些候选解被输入一个独立的评估模块进行筛选，剔除无意义或无效的结果。

在测试阶段，谷歌研究人员使用50多道公开数学难题对AlphaEvolve进行了初步测试。结果显示，在75%的情况下，系统能够重新发现人类已知的最优解。

进一步，加州大学洛杉矶分校的陶哲轩及其合作者对AlphaEvolve展开了更全面、更具挑战性的测评。此次测评涵盖67道前沿数学研究问题。测试结果表明，该系统不仅能够复现既有解法，有时还能生成更优解；这些改进后的候选解可进一步输入其他专用AI系统进行验证与深化，例如计算资源需求更高的Gemini增强版，或谷歌今年用于在国际数学奥林匹克竞赛（IMO）中斩获金牌的AlphaProof系统。

陶哲轩指出：”由于67道问题难度各异，难以给出统一的成功率指标。但可以明确的是：该系统在解题速度上始终显著快于单个数学研究者。如果按照传统方式应对这67个问题，即为每个问题单独编程开发专用优化算法，整个工作将耗时数年，项目甚至根本不会启动。AlphaEvolve使我们在前所未有的规模上开展数学研究成为可能。”

需要指出的是，AlphaEvolve目前仅适用于一类称为”优化问题”的数学问题。这类问题是要求在特定约束下寻找最优数值、公式或对象（例如：给定空间内最多可嵌入多少个正六边形）。尽管该系统已能处理数论、几何学等不同数学分支中的优化问题，陶哲轩坦言，此类问题”仅占数学家所关注问题总体的一小部分”。然而，AlphaEvolve展现出的强大能力正激励数学家尝试将非优化类问题重新建模为该系统可处理的形式。

不过，该系统也存在明显弊端：陶哲轩指出，它有时会”钻空子”，即利用问题表述中的技术漏洞或边缘情形生成看似正确、实则并未真正解决问题的答案。这就好比给一群极其聪明但毫无道德约束的学生出考题，他们只求技术性地拿到高分，不择手段。

尽管存在上述缺陷，AlphaEvolve所取得的成果仍引发了数学界更广泛的关注。据团队成员、罗德岛州布朗大学的哈维尔·戈麦斯-塞拉诺（Javier Gómez-Serrano）介绍，此前许多数学家仅对ChatGPT等通用型AI工具抱有兴趣，而AlphaEvolve的出现显著提升了其对专业AI工具的关注度。目前该系统尚未向公众开放，但团队已收到来自全球数学研究者的大量试用申请。

“人们如今明显更加好奇，也更愿意尝试这些工具，”戈麦斯-塞拉诺表示，”大家都在积极探索其潜在应用场景。相较一两年前的情形，它已在数学界激发出空前浓厚的兴趣。”

对陶哲轩而言，此类AI系统为卸下部分常规性数学工作、释放人力以聚焦更具创造性研究提供了可能：”全球数学家数量有限，我们无法对每一个问题都投入高强度思考；但现实中存在大量中等难度的问题，恰恰非常适合AlphaEvolve这类中等智能水平的工具来解决。”

宾夕法尼亚州卡内基梅隆大学的杰里米·阿维加德（Jeremy Avigad）指出，机器学习技术对数学研究正日益显现出实用价值。”当前亟需的是计算机科学家（精通机器学习工具的开发与应用）与数学家（具备领域专业知识）之间更深入的协同合作，”他表示，”我相信未来将涌现更多类似成果，并有望将这些方法拓展至更为抽象的数学分支。”

# AI资讯