[谷歌] 震惊,谷歌AI一夜连破9道世纪难题
DeepMind发布全新数学智能体AlphaProof Nexus,9道Erdős开放难题一次性告破,最老的悬了56年!全部证明都已经过Lean编译器形式化验证,没有幻觉。网友惊呼:数学奇点的火花点燃了。数学界这个月,彻底疯了。前脚OpenAI刚把Erdős 80年猜想推翻,数学家们的惊呼声还没落地。
紧接着,Google DeepMind发布了一个全新AI数学智能体——AlphaProof Nexus。
它一出手,就干掉了9道悬而未决几十年的Erdős开放问题。其中最古老的那个,悬了整整56年!
而且,每道题花费的算力成本,只有几百美元。
更关键的是,这次的证明不可能有错。
每一步推理都经过Lean编译器的形式化验证,不存在幻觉空间。编译器通过,证明就是对的。
值得一提的是,AlphaProof Nexus和2024年拿下IMO银牌的初代AlphaProof完全不同。
初代只有强化学习树搜索,Nexus把大语言模型、AlphaProof和进化算法三合一,直接瞄准了人类数学家啃不动的研究级难题。
AlphaProof Nexus,进化算法+LLM+Lean编译器这套系统的架构分为四个层级,从简单到复杂。

1. Agent A(基础版)
多个独立的证明子智能体并行工作,每个子智能体与Gemini 3.1 Pro进行多轮对话,通过搜索替换工具修改Lean代码,编译器实时反馈错误信息,子智能体根据反馈迭代修正。
2. Agent B
在A的基础上加入了AlphaProof作为工具。当子智能体在某个子目标上卡住时,可以调用AlphaProof进行强化学习驱动的树搜索,尝试攻克局部难点。
3. Agent C
引入进化算法。多个子智能体不再独立工作,而是共享一个“种群数据库”。每个证明草稿会被LLM评审员打分(用Elo评分系统),高分草稿被优先采样、变异、进化。
4. Agent D(完整版)
集大成者。进化算法 + AlphaProof + Gemini 3.1 Pro协同作战。这是DeepMind用来大规模扫荡Erdős问题的主力武器。

整个工作流的核心循环非常清晰——
AI提出证明草稿 → Lean编译器验证 → 失败则反馈错误信息 → AI修正 → 再验证 → 循环往复,直到证明完全通过或耗尽算力预算。
[物价飞涨的时候 这样省钱购物很爽]
好新闻没人评论怎么行,我来说几句
紧接着,Google DeepMind发布了一个全新AI数学智能体——AlphaProof Nexus。
它一出手,就干掉了9道悬而未决几十年的Erdős开放问题。其中最古老的那个,悬了整整56年!
而且,每道题花费的算力成本,只有几百美元。
更关键的是,这次的证明不可能有错。
每一步推理都经过Lean编译器的形式化验证,不存在幻觉空间。编译器通过,证明就是对的。
值得一提的是,AlphaProof Nexus和2024年拿下IMO银牌的初代AlphaProof完全不同。
初代只有强化学习树搜索,Nexus把大语言模型、AlphaProof和进化算法三合一,直接瞄准了人类数学家啃不动的研究级难题。
AlphaProof Nexus,进化算法+LLM+Lean编译器这套系统的架构分为四个层级,从简单到复杂。

1. Agent A(基础版)
多个独立的证明子智能体并行工作,每个子智能体与Gemini 3.1 Pro进行多轮对话,通过搜索替换工具修改Lean代码,编译器实时反馈错误信息,子智能体根据反馈迭代修正。
2. Agent B
在A的基础上加入了AlphaProof作为工具。当子智能体在某个子目标上卡住时,可以调用AlphaProof进行强化学习驱动的树搜索,尝试攻克局部难点。
3. Agent C
引入进化算法。多个子智能体不再独立工作,而是共享一个“种群数据库”。每个证明草稿会被LLM评审员打分(用Elo评分系统),高分草稿被优先采样、变异、进化。
4. Agent D(完整版)
集大成者。进化算法 + AlphaProof + Gemini 3.1 Pro协同作战。这是DeepMind用来大规模扫荡Erdős问题的主力武器。

整个工作流的核心循环非常清晰——
AI提出证明草稿 → Lean编译器验证 → 失败则反馈错误信息 → AI修正 → 再验证 → 循环往复,直到证明完全通过或耗尽算力预算。
[物价飞涨的时候 这样省钱购物很爽]
| 分享: |
| 注: | 在此页阅读全文 |
| 延伸阅读 | 更多... |
推荐: