Warning: session_start(): open(/var/www/vhosts/vandaily.com/php_session/sess_c6937d1034116832b0a02462bab6b001, O_RDWR) failed: No space left on device (28) in /var/www/vhosts/vandaily.com/httpdocs/includes/session_new.php on line 34
震惊,谷歌AI一夜连破9道世纪难题 | 温哥华教育中心
   

[谷歌] 震惊,谷歌AI一夜连破9道世纪难题




项目地址:

https://github.com/google-deepmind/alphaproof-nexus-results

简单Agent也能解全部9题?!最出人意料的结论,不是完整版Agent D有多强,而是——

最简单的Agent A,也能解决全部9道问题。

Agent A没有进化算法,没有AlphaProof,只有多个独立的LLM子智能体和Lean编译器的反馈循环。

根据DeepMind团队的对比分析,它在大多数问题上,Agent A和Agent B(加了AlphaProof的版本)的表现在误差范围内几乎相同。

相比之下,Agent D的优势主要体现在最困难的问题上(比如#125和#138),能以2到5倍的成本优势完成证明。



对此,DeepMind将基础Agent的成功归因于两个因素:LLM自身能力的飙升,以及编译器反馈在锚定LLM推理方面的强大作用。

也就是说,随着基础模型越来越强,复杂的系统工程可能逐渐让位于简单的智能体循环。


今天需要进化算法和AlphaProof协同作战才能高效解决的问题,明天可能一个朴素的LLM+编译器循环就够了。



具体到成本,最便宜的一道题(#741(ii))中位成本仅5-7美元,最贵的(#152)也不过200-400美元。

但前提是用对了模型——单独运行AlphaProof或使用较小模型(Gemini 3.0 Flash等),9道题一道都解不出来。



[加西网正招聘多名全职sales 待遇优]
还没人说话啊,我想来说几句
注:
  • 新闻来源于其它媒体,内容不代表本站立场!
  • 在此页阅读全文
     延伸阅读 更多...
    Google自爆雷?Pixel11神秘新功能引热议 谷歌时隔十余年再推智慧眼镜 私隐问题仍受关注
    谷歌150亿美元建数据中心,还帮居民交电费? 谷歌用AI"杀死"谷歌,这场发布会看得人缺氧
    谷歌推出最新AI模型,皮查伊要帮大客户年省10亿 Google开发者大会狂秀黑科技 5大重点一次看
    分析帐单....Google发布个人AI代理Spark 谷歌前CEO毕业典礼谈AI被狂嘘 反对者是"穴居人"?
    Google新功能曝光 即时翻译不用网络也能用 伊朗盯上海底电缆 威胁谷歌微软 恐引发"数位灾难"
     推荐:

    意见

    当前评论目前还没有任何评论,欢迎您发表您的看法。
    发表评论
    您的评论 *: 
    安全校验码 *:  请在此处输入图片中的数字
    The Captcha image  (请在此处输入图片中的数字)



    Copyright © 温哥华网, all rights are reserved.

    温哥华网为北美中文网传媒集团旗下网站