震驚,谷歌AI壹夜連破9道世紀難題

[谷歌] 震驚,谷歌AI壹夜連破9道世紀難題

2026-05-25 | 來源: 新智元 | 有0人參與評論 | 字體: 放大縮小 | 收藏 | 打印

DeepMind發布全新數學智能體AlphaProof Nexus，9道Erdős開放難題壹次性告破，最老的懸了56年！全部證明都已經過Lean編譯器形式化驗證，沒有幻覺。網友驚呼：數學奇點的火花點燃了。數學界這個月，徹底瘋了。前腳OpenAI剛把Erdős 80年猜想推翻，數學家們的驚呼聲還沒落地。

緊接著，Google DeepMind發布了壹個全新AI數學智能體——AlphaProof Nexus。

它壹出手，就幹掉了9道懸而未決幾拾年的Erdős開放問題。其中最古老的那個，懸了整整56年！

而且，每道題花費的算力成本，只有幾百美元。

更關鍵的是，這次的證明不可能有錯。

每壹步推理都經過Lean編譯器的形式化驗證，不存在幻覺空間。編譯器通過，證明就是對的。

值得壹提的是，AlphaProof Nexus和2024年拿下IMO銀牌的初代AlphaProof完全不同。

初代只有強化學習樹搜索，Nexus把大語言模型、AlphaProof和進化算法叁合壹，直接瞄准了人類數學家啃不動的研究級難題。

AlphaProof Nexus，進化算法+LLM+Lean編譯器這套系統的架構分為肆個層級，從簡單到復雜。

1. Agent A（基礎版）

多個獨立的證明子智能體並行工作，每個子智能體與Gemini 3.1 Pro進行多輪對話，通過搜索替換工具修改Lean代碼，編譯器實時反饋錯誤信息，子智能體根據反饋迭代修正。

2. Agent B

在A的基礎上加入了AlphaProof作為工具。當子智能體在某個子目標上卡住時，可以調用AlphaProof進行強化學習驅動的樹搜索，嘗試攻克局部難點。

3. Agent C

引入進化算法。多個子智能體不再獨立工作，而是共享壹個“種群數據庫”。每個證明草稿會被LLM評審員打分（用Elo評分系統），高分草稿被優先采樣、變異、進化。

4. Agent D（完整版）

集大成者。進化算法 + AlphaProof + Gemini 3.1 Pro協同作戰。這是DeepMind用來大規模掃蕩Erdős問題的主力武器。

整個工作流的核心循環非常清晰——

AI提出證明草稿 → Lean編譯器驗證 → 失敗則反饋錯誤信息 → AI修正 → 再驗證 → 循環往復，直到證明完全通過或耗盡算力預算。

[物價飛漲的時候這樣省錢購物很爽] 這條新聞還沒有人評論喔，等著您的高見呢

分享:

上壹頁12 3 4 5 下壹頁

注：

新聞來源於其它媒體，內容不代表本站立場！

在此頁閱讀全文

意見

當前評論目前還沒有任何評論，歡迎您發表您的看法。

發表評論

專家專欄

工具

當前會員

[谷歌] 震驚,谷歌AI壹夜連破9道世紀難題

意見