DeepSeek Prover V2：AI数学推理挑战者，88.9%通过率

AI资讯1年前 (2025)发布 ainav

222 0 0

5月1日，深度求索（DeepSeek）于4月30日在AI开源社区Hugging Face发布了一款名为DeepSeek-Prover-V2-671B的新模型，并在GitHub等平台公布了相关论文信息。

据论文介绍，DeepSeek-Prover-V2是一款专注于形式化数学推理的开源大型语言模型，基于DeepSeek-V3-0324构建而成。该模型通过递归定理证明管道生成初始数据，为数学推理领域提供了新的解决方案。

此次发布的模型包括：DeepSeek-Prover-V2-671B（基于V3大模型）和DeepSeek-Prover-V2-7B（增强版模型），同时推出了专门的数据集 DeepSeek-ProverBench 。

DeepSeek-Prover-V2-671B采用了与DeepSeek V3-0324相同的架构设计，主要面向复杂的数学推理任务。该模型能够对数学定理进行分解、证明和验证，展现出强大的逻辑推理能力。

DeepSeek团队还推出了ProverBench基准数据集，包含325个形式化数学问题。其中，15道题目来自近期的AIME竞赛（包括第24和25题），涵盖了数论与代数领域的内容，难度相当于高中竞赛水平。

其余310个问题则精选自教材和教学内容，涉及线性代数、微积分、概率等多学科知识。这一数据集旨在为高中数学竞赛和大学数学教育提供标准化评估工具，帮助模型在多样化应用场景中得到充分验证。

相关阅读：

文章版权归作者所有，未经允许请勿转载。

ainav

191 0

ainav

197 0

ainav

158 0

ainav

138 0

ainav

234 0

ainav

190 0