GPT-5.2被曝作弊!不如Gemini 3(图

GPT-5.2打赢Gemini 3.0 Pro,竟是靠高推理与海量Token“作弊”?网友的这个发现,在AI社区一石激起千层浪。更多网友七嘴八舌表示:GPT-5.2,并没有那么好用!


太戏剧了。

OpenAI昨天刚放出大杀器GPT-5.2,今天就被曝疑似虚假营销?

凌晨的科技圈,被一则爆料点燃——

一位用户通过精细计算发现了“华点”:OpenAI在最新发布的基准测试中,可能通过调整模型“推理力度”参数,让GPT-5.2在关键评测中使用了远超对手的算力资源。

一句话总结就是:在调整token使用后,GPT-5.2和Gemini 3 Pro在ARC AGI 2上的表现基本相当。

具体来说,问题就出在这几张图上。

可以看到,OpenAI在基准测试中使用了额外的token,至少是Gemini 3.0 Pro的两倍。

这就像两个棋手对弈,一方被允许思考一个小时,另一方却只有十分钟,然后宣布前者获胜。





在这种情况下,结果还公平吗?


OpenAI胜过谷歌,其实靠作弊?

昨天的AI圈,都被GPT-5.2吊打Gemini 3.0 Pro的结论所震撼,而前者在ARC AGI 2的精彩表现,则尤为出圈,被AI社区大加赞赏。

但现在,这些结果很可能注了水?



比如在备受关注的ARC AGI 2测试中,GPT-5.2 xhigh版得分52.9%,每个任务消耗约13.5万个token。

按API定价计算,每个任务仅算力成本就高达1.9美元。

[加西网正招聘多名全职sales 待遇优]
好新闻没人评论怎么行,我来说几句
上一页1234...7下一页
注:
  • 新闻来源于其它媒体,内容不代表本站立场!
  • 在此页阅读全文
     延伸阅读
    华尔街彻夜难眠,Gemini 3屠榜金融"最难考试" ChatGPT/Gemini最强流量 竟是"这需求"
    谷歌翻译引入Gemini技术,支持耳机实时翻译 GPT-5.2获封"最强打工人" Gemini"性价比"系列应战
    读完8家顶级投行的2026展望,Gemini给总结 Google Gemini最新功能曝光 画圈搜寻落伍了
    Google首席AI架构师:Gemini 逆风翻盘有18个关键 用了两天谷歌Gemini 3 感觉它彻底疯狂了
    谷歌 Gemini 3 深夜炸场:没有悬念的最强 AI Gemini 3获盛赞 谷歌股价一度涨近7% 创历史新高
     推荐:

    意见

    当前评论目前还没有任何评论,欢迎您发表您的看法。
    发表评论
    您的评论 *: 
    安全校验码 *:  请在此处输入图片中的数字
    The Captcha image  (请在此处输入图片中的数字)



    Copyright © 温哥华网, all rights are reserved.

    温哥华网为北美中文网传媒集团旗下网站