震驚,谷歌AI壹夜連破9道世紀難題

[谷歌] 震驚,谷歌AI壹夜連破9道世紀難題

2026-05-25 | 來源: 新智元 | 有0人參與評論 | 字體: 放大縮小 | 收藏 | 打印

項目地址：

https://github.com/google-deepmind/alphaproof-nexus-results

簡單Agent也能解全部9題？！最出人意料的結論，不是完整版Agent D有多強，而是——

最簡單的Agent A，也能解決全部9道問題。

Agent A沒有進化算法，沒有AlphaProof，只有多個獨立的LLM子智能體和Lean編譯器的反饋循環。

根據DeepMind團隊的對比分析，它在大多數問題上，Agent A和Agent B（加了AlphaProof的版本）的表現在誤差范圍內幾乎相同。

相比之下，Agent D的優勢主要體現在最困難的問題上（比如#125和#138），能以2到5倍的成本優勢完成證明。

對此，DeepMind將基礎Agent的成功歸因於兩個因素：LLM自身能力的飆升，以及編譯器反饋在錨定LLM推理方面的強大作用。

也就是說，隨著基礎模型越來越強，復雜的系統工程可能逐漸讓位於簡單的智能體循環。

今天需要進化算法和AlphaProof協同作戰才能高效解決的問題，明天可能壹個樸素的LLM+編譯器循環就夠了。

具體到成本，最便宜的壹道題（#741(ii)）中位成本僅5-7美元，最貴的（#152）也不過200-400美元。

但前提是用對了模型——單獨運行AlphaProof或使用較小模型（Gemini 3.0 Flash等），9道題壹道都解不出來。

[物價飛漲的時候這樣省錢購物很爽] 好新聞沒人評論怎麼行，我來說幾句

分享:

上壹頁 1 234 5 下壹頁

注：

新聞來源於其它媒體，內容不代表本站立場！

在此頁閱讀全文

延伸閱讀

更多...

谷歌是如何"逆風翻盤"、開始贏得人工智能競賽的?	Google自爆雷?Pixel11神秘新功能引熱議
谷歌時隔拾余年再推智慧眼鏡私隱問題仍受關注	谷歌150億美元建數據中心,還幫居民交電費?
谷歌用AI"殺死"谷歌,這場發布會看得人缺氧	谷歌推出最新AI模型,皮查伊要幫大客戶年省10億
Google開發者大會狂秀黑科技 5大重點壹次看	分析帳單....Google發布個人AI代理Spark
谷歌前CEO畢業典禮談AI被狂噓反對者是"穴居人"?	Google新功能曝光即時翻譯不用網絡也能用

意見

當前評論目前還沒有任何評論，歡迎您發表您的看法。

發表評論

手機版本

專家專欄

新樓盤

當前會員

地產中文書籍

[谷歌] 震驚,谷歌AI壹夜連破9道世紀難題

意見