Warning: session_start(): open(/var/www/vhosts/vandaily.com/php_session/sess_c6937d1034116832b0a02462bab6b001, O_RDWR) failed: No space left on device (28) in /var/www/vhosts/vandaily.com/httpdocs/includes/session_new.php on line 34
震驚,谷歌AI壹夜連破9道世紀難題 | 溫哥華教育中心
   

[谷歌] 震驚,谷歌AI壹夜連破9道世紀難題

DeepMind發布全新數學智能體AlphaProof Nexus,9道Erdős開放難題壹次性告破,最老的懸了56年!全部證明都已經過Lean編譯器形式化驗證,沒有幻覺。網友驚呼:數學奇點的火花點燃了。數學界這個月,徹底瘋了。前腳OpenAI剛把Erdős 80年猜想推翻,數學家們的驚呼聲還沒落地。


緊接著,Google DeepMind發布了壹個全新AI數學智能體——AlphaProof Nexus。

它壹出手,就幹掉了9道懸而未決幾拾年的Erdős開放問題。其中最古老的那個,懸了整整56年!

而且,每道題花費的算力成本,只有幾百美元。

更關鍵的是,這次的證明不可能有錯。

每壹步推理都經過Lean編譯器的形式化驗證,不存在幻覺空間。編譯器通過,證明就是對的。

值得壹提的是,AlphaProof Nexus和2024年拿下IMO銀牌的初代AlphaProof完全不同。

初代只有強化學習樹搜索,Nexus把大語言模型、AlphaProof和進化算法叁合壹,直接瞄准了人類數學家啃不動的研究級難題。

AlphaProof Nexus,進化算法+LLM+Lean編譯器這套系統的架構分為肆個層級,從簡單到復雜。



1. Agent A(基礎版)

多個獨立的證明子智能體並行工作,每個子智能體與Gemini 3.1 Pro進行多輪對話,通過搜索替換工具修改Lean代碼,編譯器實時反饋錯誤信息,子智能體根據反饋迭代修正。

2. Agent B

在A的基礎上加入了AlphaProof作為工具。當子智能體在某個子目標上卡住時,可以調用AlphaProof進行強化學習驅動的樹搜索,嘗試攻克局部難點。


3. Agent C

引入進化算法。多個子智能體不再獨立工作,而是共享壹個“種群數據庫”。每個證明草稿會被LLM評審員打分(用Elo評分系統),高分草稿被優先采樣、變異、進化。

4. Agent D(完整版)

集大成者。進化算法 + AlphaProof + Gemini 3.1 Pro協同作戰。這是DeepMind用來大規模掃蕩Erdős問題的主力武器。



整個工作流的核心循環非常清晰——

AI提出證明草稿 → Lean編譯器驗證 → 失敗則反饋錯誤信息 → AI修正 → 再驗證 → 循環往復,直到證明完全通過或耗盡算力預算。

[物價飛漲的時候 這樣省錢購物很爽]
這條新聞還沒有人評論喔,等著您的高見呢
上壹頁12345下壹頁
注:
  • 新聞來源於其它媒體,內容不代表本站立場!
  • 在此頁閱讀全文
     延伸閱讀 更多...
    Google自爆雷?Pixel11神秘新功能引熱議 谷歌時隔拾余年再推智慧眼鏡 私隱問題仍受關注
    谷歌150億美元建數據中心,還幫居民交電費? 谷歌用AI"殺死"谷歌,這場發布會看得人缺氧
    谷歌推出最新AI模型,皮查伊要幫大客戶年省10億 Google開發者大會狂秀黑科技 5大重點壹次看
    分析帳單....Google發布個人AI代理Spark 谷歌前CEO畢業典禮談AI被狂噓 反對者是"穴居人"?
    Google新功能曝光 即時翻譯不用網絡也能用 伊朗盯上海底電纜 威脅谷歌微軟 恐引發"數位災難"
     推薦:

    意見

    當前評論目前還沒有任何評論,歡迎您發表您的看法。
    發表評論
    您的評論 *: 
    安全校驗碼 *:  請在此處輸入圖片中的數字
    The Captcha image  (請在此處輸入圖片中的數字)



    Copyright © 溫哥華網, all rights are reserved.

    溫哥華網為北美中文網傳媒集團旗下網站