GPT-5.2降智遭全网差评!奥特曼慌了

年终AI大戏,OpenAI败给了谷歌?GPT-5.2上线48小时,全网吐槽一大片。第三方数据实证,Gemini 3 Pro才是真正的王者。


OpenAI打出了GPT-5.2这张“年度王牌”,却没有打赢谷歌...

Epoch AI最新报告,GPT-5.2的能力指数(ECI)得分152,仅次于Gemini 3 Pro。

在多项基准测试中,GPT-5.2的实力并没有“全线霸榜”。

在由陶哲轩联手百位数学家出的考题——FrontierMath中,GPT-5.2仅在T1-3级中霸榜,T4还是Gemini 3的高地。

另外,在国际象棋Chess Puzzles中,GPT-5.2拿下了第一的成绩。

唯一例外的是,在SimpleQA Verified上,GPT-5.2都不及GPT-5.1,意味着迭代后的可信度更差了。

不仅如此,多个第三方基准评测显示,GPT-5.2远不及预期,没有打败Gemini 3。

包括OCR-Arena、simple-bench、Live-Bench上,GPT-5.2甚至都排在了Claude Opus 4.5之后。

发布仅两天,GPT-5.2水花不大,反而圈子里开发者吐槽的不少。

为了打赢这场硬仗,OpenAI拉响“红色警报”,把改进ChatGPT事项提到了优先级。

更极端的是,内部直接停掉了AGI的研发,Sora也暂停了八周,显然摆出了破釜沉舟的姿态。



可是呢,在业界来看,OpenAI至今仍未摆脱被动的局面。

GPT-5重度用户站出来发声,“GPT-5.2距离成为一块石头也不远了”。

年终之战,OpenAI败了?

三年前,谷歌因错失先机,被OpenAI ChatGPT抢尽了风头。

昨天,谷歌创始人谢尔盖·布林重返斯坦福演讲,现场公开承认曾经的“最大失误”:

我们搞砸了——太怕AI说错话,结果输掉一个时代。

如今,凭借Gemini 3 Pro+Nano Banana Pro,谷歌已重回AI浪潮之巅。

风水轮流转。这一次,轮到了OpenAI,却在2025年这场关键战役中自乱阵脚。

上线首日,奥特曼激动宣称,API调用量就超过了万亿token,且增长速度极快


此前Information爆料,GPT-5.2,代号大蒜(Garlic),原计划在明年初亮相。

整个硅谷,曾透露了一种风声——OpenAI预训练终结了,甚至GPT-5.1可能基于4o后训练而来,由此提升不大。

确实如此,在预训练上,OpenAI遇到了Scaling瓶颈。

预训练Scaling,或许不大

在GPT-5.2(大蒜)研发上,原爆料称,OpenAI解决了预训练环节遇到的一些关键问题——

改进之前“最好的”且“体量大得多”的预训练模型。

在内部,OpenAI整合了在开发“Shallotpeat”期间修复的Bug,积累了许多预训练的经验。

正如Information所言,最关键的突破发生在“预训练阶段”。

但以上的一切信息,都是新闻报道。OpenAI究竟在预训练上,是否实现了重大突破,难以得知。

但从官方全线击败Gemini 3基准上可以猜测,GPT-5.2在预训练方面取得了一定的改进。

但是从第三方评测和网友反馈中,GPT-5.2在底层技术迭代上,没有实现突破式的进展。Epoch AI另一项评估中,顶尖AI大模型在长程任务的性能,Gemini 3依旧是最强的——

[物价飞涨的时候 这样省钱购物很爽]
这条新闻还没有人评论喔,等着您的高见呢
上一页1234...8下一页
注:
  • 新闻来源于其它媒体,内容不代表本站立场!
  • 在此页阅读全文
     延伸阅读
    和马斯克杠上 奥特曼想投资火箭公司与SpaceX竞争 奥特曼拉响"红色警报",OpenAI到底怎么了?
    OpenAI 生死时刻?奥特曼内部信曝光 OpenAI"至暗时刻"已至,谷歌一剑封喉奥特曼
    OpenAI CEO奥特曼2024薪酬曝光 丑闻缠身的... 1条短信7年恩怨!奥特曼与马斯克决裂新隐情
    OpenAI奥特曼为黄仁勋说话 男子突然冲上台… "政府担保论引发担忧",奥特曼紧急澄清
    OpenAI宫斗后续:奥特曼"黑料"曝 美女CTO打小报告 不需手术....奥特曼脑机公司技术曝光
     推荐:

    意见

    当前评论目前还没有任何评论,欢迎您发表您的看法。
    发表评论
    您的评论 *: 
    安全校验码 *:  请在此处输入图片中的数字
    The Captcha image  (请在此处输入图片中的数字)



    Copyright © 温哥华网, all rights are reserved.

    温哥华网为北美中文网传媒集团旗下网站