震惊,谷歌AI一夜连破9道世纪难题

[谷歌] 震惊,谷歌AI一夜连破9道世纪难题

2026-05-25 | 来源: 新智元 | 有0人参与评论 | 字体: 放大缩小 | 收藏 | 打印

DeepMind发布全新数学智能体AlphaProof Nexus，9道Erdős开放难题一次性告破，最老的悬了56年！全部证明都已经过Lean编译器形式化验证，没有幻觉。网友惊呼：数学奇点的火花点燃了。数学界这个月，彻底疯了。前脚OpenAI刚把Erdős 80年猜想推翻，数学家们的惊呼声还没落地。

紧接着，Google DeepMind发布了一个全新AI数学智能体——AlphaProof Nexus。

它一出手，就干掉了9道悬而未决几十年的Erdős开放问题。其中最古老的那个，悬了整整56年！

而且，每道题花费的算力成本，只有几百美元。

更关键的是，这次的证明不可能有错。

每一步推理都经过Lean编译器的形式化验证，不存在幻觉空间。编译器通过，证明就是对的。

值得一提的是，AlphaProof Nexus和2024年拿下IMO银牌的初代AlphaProof完全不同。

初代只有强化学习树搜索，Nexus把大语言模型、AlphaProof和进化算法三合一，直接瞄准了人类数学家啃不动的研究级难题。

AlphaProof Nexus，进化算法+LLM+Lean编译器这套系统的架构分为四个层级，从简单到复杂。

1. Agent A（基础版）

多个独立的证明子智能体并行工作，每个子智能体与Gemini 3.1 Pro进行多轮对话，通过搜索替换工具修改Lean代码，编译器实时反馈错误信息，子智能体根据反馈迭代修正。

2. Agent B

在A的基础上加入了AlphaProof作为工具。当子智能体在某个子目标上卡住时，可以调用AlphaProof进行强化学习驱动的树搜索，尝试攻克局部难点。

3. Agent C

引入进化算法。多个子智能体不再独立工作，而是共享一个“种群数据库”。每个证明草稿会被LLM评审员打分（用Elo评分系统），高分草稿被优先采样、变异、进化。

4. Agent D（完整版）

集大成者。进化算法 + AlphaProof + Gemini 3.1 Pro协同作战。这是DeepMind用来大规模扫荡Erdős问题的主力武器。

整个工作流的核心循环非常清晰——

AI提出证明草稿 → Lean编译器验证 → 失败则反馈错误信息 → AI修正 → 再验证 → 循环往复，直到证明完全通过或耗尽算力预算。

[物价飞涨的时候这样省钱购物很爽] 好新闻没人评论怎么行，我来说几句

分享:

注：

新闻来源于其它媒体，内容不代表本站立场！

在此页阅读全文

意见

当前评论目前还没有任何评论，欢迎您发表您的看法。

发表评论

专家专栏

工具

当前会员

[谷歌] 震惊,谷歌AI一夜连破9道世纪难题

意见