震惊,谷歌AI一夜连破9道世纪难题

[谷歌] 震惊,谷歌AI一夜连破9道世纪难题

2026-05-25 | 来源: 新智元 | 有0人参与评论 | 字体: 放大缩小 | 收藏 | 打印

项目地址：

https://github.com/google-deepmind/alphaproof-nexus-results

简单Agent也能解全部9题？！最出人意料的结论，不是完整版Agent D有多强，而是——

最简单的Agent A，也能解决全部9道问题。

Agent A没有进化算法，没有AlphaProof，只有多个独立的LLM子智能体和Lean编译器的反馈循环。

根据DeepMind团队的对比分析，它在大多数问题上，Agent A和Agent B（加了AlphaProof的版本）的表现在误差范围内几乎相同。

相比之下，Agent D的优势主要体现在最困难的问题上（比如#125和#138），能以2到5倍的成本优势完成证明。

对此，DeepMind将基础Agent的成功归因于两个因素：LLM自身能力的飙升，以及编译器反馈在锚定LLM推理方面的强大作用。

也就是说，随着基础模型越来越强，复杂的系统工程可能逐渐让位于简单的智能体循环。

今天需要进化算法和AlphaProof协同作战才能高效解决的问题，明天可能一个朴素的LLM+编译器循环就够了。

具体到成本，最便宜的一道题（#741(ii)）中位成本仅5-7美元，最贵的（#152）也不过200-400美元。

但前提是用对了模型——单独运行AlphaProof或使用较小模型（Gemini 3.0 Flash等），9道题一道都解不出来。

[加西网正招聘多名全职sales 待遇优] 还没人说话啊，我想来说几句

分享:

注：

新闻来源于其它媒体，内容不代表本站立场！

在此页阅读全文

延伸阅读

更多...

Google自爆雷?Pixel11神秘新功能引热议	谷歌时隔十余年再推智慧眼镜私隐问题仍受关注
谷歌150亿美元建数据中心,还帮居民交电费?	谷歌用AI"杀死"谷歌,这场发布会看得人缺氧
谷歌推出最新AI模型,皮查伊要帮大客户年省10亿	Google开发者大会狂秀黑科技 5大重点一次看
分析帐单....Google发布个人AI代理Spark	谷歌前CEO毕业典礼谈AI被狂嘘反对者是"穴居人"?
Google新功能曝光即时翻译不用网络也能用	伊朗盯上海底电缆威胁谷歌微软恐引发"数位灾难"

意见

当前评论目前还没有任何评论，欢迎您发表您的看法。

发表评论

专家专栏

工具

当前会员

[谷歌] 震惊,谷歌AI一夜连破9道世纪难题

意见