[谷歌] 震驚,谷歌AI壹夜連破9道世紀難題
DeepMind發布全新數學智能體AlphaProof Nexus,9道Erdős開放難題壹次性告破,最老的懸了56年!全部證明都已經過Lean編譯器形式化驗證,沒有幻覺。網友驚呼:數學奇點的火花點燃了。數學界這個月,徹底瘋了。前腳OpenAI剛把Erdős 80年猜想推翻,數學家們的驚呼聲還沒落地。
緊接著,Google DeepMind發布了壹個全新AI數學智能體——AlphaProof Nexus。
它壹出手,就幹掉了9道懸而未決幾拾年的Erdős開放問題。其中最古老的那個,懸了整整56年!
而且,每道題花費的算力成本,只有幾百美元。
更關鍵的是,這次的證明不可能有錯。
每壹步推理都經過Lean編譯器的形式化驗證,不存在幻覺空間。編譯器通過,證明就是對的。
值得壹提的是,AlphaProof Nexus和2024年拿下IMO銀牌的初代AlphaProof完全不同。
初代只有強化學習樹搜索,Nexus把大語言模型、AlphaProof和進化算法叁合壹,直接瞄准了人類數學家啃不動的研究級難題。
AlphaProof Nexus,進化算法+LLM+Lean編譯器這套系統的架構分為肆個層級,從簡單到復雜。

1. Agent A(基礎版)
多個獨立的證明子智能體並行工作,每個子智能體與Gemini 3.1 Pro進行多輪對話,通過搜索替換工具修改Lean代碼,編譯器實時反饋錯誤信息,子智能體根據反饋迭代修正。
2. Agent B
在A的基礎上加入了AlphaProof作為工具。當子智能體在某個子目標上卡住時,可以調用AlphaProof進行強化學習驅動的樹搜索,嘗試攻克局部難點。
3. Agent C
引入進化算法。多個子智能體不再獨立工作,而是共享壹個“種群數據庫”。每個證明草稿會被LLM評審員打分(用Elo評分系統),高分草稿被優先采樣、變異、進化。
4. Agent D(完整版)
集大成者。進化算法 + AlphaProof + Gemini 3.1 Pro協同作戰。這是DeepMind用來大規模掃蕩Erdős問題的主力武器。

整個工作流的核心循環非常清晰——
AI提出證明草稿 → Lean編譯器驗證 → 失敗則反饋錯誤信息 → AI修正 → 再驗證 → 循環往復,直到證明完全通過或耗盡算力預算。
[物價飛漲的時候 這樣省錢購物很爽]
這條新聞還沒有人評論喔,等著您的高見呢
緊接著,Google DeepMind發布了壹個全新AI數學智能體——AlphaProof Nexus。
它壹出手,就幹掉了9道懸而未決幾拾年的Erdős開放問題。其中最古老的那個,懸了整整56年!
而且,每道題花費的算力成本,只有幾百美元。
更關鍵的是,這次的證明不可能有錯。
每壹步推理都經過Lean編譯器的形式化驗證,不存在幻覺空間。編譯器通過,證明就是對的。
值得壹提的是,AlphaProof Nexus和2024年拿下IMO銀牌的初代AlphaProof完全不同。
初代只有強化學習樹搜索,Nexus把大語言模型、AlphaProof和進化算法叁合壹,直接瞄准了人類數學家啃不動的研究級難題。
AlphaProof Nexus,進化算法+LLM+Lean編譯器這套系統的架構分為肆個層級,從簡單到復雜。

1. Agent A(基礎版)
多個獨立的證明子智能體並行工作,每個子智能體與Gemini 3.1 Pro進行多輪對話,通過搜索替換工具修改Lean代碼,編譯器實時反饋錯誤信息,子智能體根據反饋迭代修正。
2. Agent B
在A的基礎上加入了AlphaProof作為工具。當子智能體在某個子目標上卡住時,可以調用AlphaProof進行強化學習驅動的樹搜索,嘗試攻克局部難點。
3. Agent C
引入進化算法。多個子智能體不再獨立工作,而是共享壹個“種群數據庫”。每個證明草稿會被LLM評審員打分(用Elo評分系統),高分草稿被優先采樣、變異、進化。
4. Agent D(完整版)
集大成者。進化算法 + AlphaProof + Gemini 3.1 Pro協同作戰。這是DeepMind用來大規模掃蕩Erdős問題的主力武器。

整個工作流的核心循環非常清晰——
AI提出證明草稿 → Lean編譯器驗證 → 失敗則反饋錯誤信息 → AI修正 → 再驗證 → 循環往復,直到證明完全通過或耗盡算力預算。
[物價飛漲的時候 這樣省錢購物很爽]
| 分享: |
| 注: | 在此頁閱讀全文 |
| 延伸閱讀 | 更多... |
推薦: