Godel-Verifier —— 开源的自动化数学问题形式证明生成推理模型

311 0 0

Godel-Prover指的是什么？

哥德尔验证器（Gödel-Prover）是由普林斯顿大学、清华大学等多家机构联合开发的一款开源大型语言模型(LLM)，专门用于数学问题的形式化自动证明。该系统通过将自然语言描述的数学题目转换成形式化的表达方式，比如Lean 4中的表述，从而生成正式的证明过程，旨在解决现有形式化数学陈述及证明资源匮乏的问题。哥德尔验证器采用专家迭代训练策略，在不断扩大的正式证明数据集基础上逐步增强其推理能力。在多个测试标准下表现优异，例如在miniF2F评估中实现了57.6%的成功率，远超同类开源软件的表现水平。此外，它还在PutnamBench上解决了其中的7个难题，并为Lean Workbook贡献了近3万份正式证明文件，在自动化定理验证领域取得了重要进展。

Godel-验证器的核心作用

结构化转换把自然语言中的数学题目转化为正式的语言表述，以保证转化过程既精确又全面。
验证创建能够生成全面的证明，并支持高级的数学推理过程。
提升效能通过采用专家迭代技术持续改进验证效能，以提高验证的成功率。
海量数据管理：构建并操作大量形式化的声明与验证数据集合，以增强模型的泛化性能。

Gödel验证器的工作机制

结构化翻译由于提供的内容为空，没有具体的信息或文本可以进行伪原创改写。如果有具体的段落或者句子需要帮助，请提供详细信息。这样我才能按照您的要求完成任务。
- 采用两种格式转换工具（FormatConverter X与FormatConverter Y），将日常表述的数学题目转化为适用于Lean 4编程环境的专业术语。这两种工具各自利用独特的数据库进行优化，从而促进多样化的形式表达方式。
- 通过实施编译准确性（CC）检验及忠实度与完备性（FC）检验来评定形式化描述的质量，以保证它既遵循Lean语法规则又能精确反映原问题的核心意义。
专家循环（Expert Loop）在起始阶段，利用现有的验证工具（例如DeepSeek-Prover-V1.5-RL），为每个形式化的声明产生多份可能的证明方案。通过Lean编译器检查这些证明的有效性并保留正确的那些作为训练样本。接下来，用基础模型（比如DeepSeek-Prover-V1.5-Base）对选定的数据进行有监督的微调，以创建改进版的验证工具。此过程可迭代执行，在每次循环中使用新生成的验证工具有助于产生更多的证明，并把这些新的证据添加到训练数据集中，从而不断增强模型自身的证明效能。
扩充数据集合除了利用公开的Numina数据集之外，Goedel-Prover还系统地整理了大量的私人收集数学问题，并将这些内容与Lean Workbook中已有的陈述整合起来，构建了一个大规模的形式化表述数据库。在训练阶段逐步引入如Mathlib4之类的外部资源，以提高模型对各类数学领域的适应性。

Gödel-验证器的项目位置

Git代码库：在GitHub上的项目链接为https://github.com/Goedel-LM/Goedel-Prover
HuggingFace的模型集合库访问此链接以查看Goedel-LM的Goedel-Prover模型：https://huggingface.co/Goedel-LM/Goedel-Prover
关于arXiv上的科技学术文章访问链接中的研究论文可以在arXiv的在线数据库中找到，具体路径为：https://arxiv.org/pdf/2502.07640v1。这篇文档包含了最新上传的研究成果。