GPT-5.2降智遭全网差评!奥特曼慌了
年终AI大戏,OpenAI败给了谷歌?GPT-5.2上线48小时,全网吐槽一大片。第三方数据实证,Gemini 3 Pro才是真正的王者。
OpenAI打出了GPT-5.2这张“年度王牌”,却没有打赢谷歌...
Epoch AI最新报告,GPT-5.2的能力指数(ECI)得分152,仅次于Gemini 3 Pro。
在多项基准测试中,GPT-5.2的实力并没有“全线霸榜”。
在由陶哲轩联手百位数学家出的考题——FrontierMath中,GPT-5.2仅在T1-3级中霸榜,T4还是Gemini 3的高地。
另外,在国际象棋Chess Puzzles中,GPT-5.2拿下了第一的成绩。
唯一例外的是,在SimpleQA Verified上,GPT-5.2都不及GPT-5.1,意味着迭代后的可信度更差了。
不仅如此,多个第三方基准评测显示,GPT-5.2远不及预期,没有打败Gemini 3。
包括OCR-Arena、simple-bench、Live-Bench上,GPT-5.2甚至都排在了Claude Opus 4.5之后。
发布仅两天,GPT-5.2水花不大,反而圈子里开发者吐槽的不少。
为了打赢这场硬仗,OpenAI拉响“红色警报”,把改进ChatGPT事项提到了优先级。
更极端的是,内部直接停掉了AGI的研发,Sora也暂停了八周,显然摆出了破釜沉舟的姿态。

可是呢,在业界来看,OpenAI至今仍未摆脱被动的局面。
GPT-5重度用户站出来发声,“GPT-5.2距离成为一块石头也不远了”。
年终之战,OpenAI败了?
三年前,谷歌因错失先机,被OpenAI ChatGPT抢尽了风头。
昨天,谷歌创始人谢尔盖·布林重返斯坦福演讲,现场公开承认曾经的“最大失误”:
我们搞砸了——太怕AI说错话,结果输掉一个时代。
如今,凭借Gemini 3 Pro+Nano Banana Pro,谷歌已重回AI浪潮之巅。
风水轮流转。这一次,轮到了OpenAI,却在2025年这场关键战役中自乱阵脚。
上线首日,奥特曼激动宣称,API调用量就超过了万亿token,且增长速度极快
此前Information爆料,GPT-5.2,代号大蒜(Garlic),原计划在明年初亮相。
整个硅谷,曾透露了一种风声——OpenAI预训练终结了,甚至GPT-5.1可能基于4o后训练而来,由此提升不大。
确实如此,在预训练上,OpenAI遇到了Scaling瓶颈。
预训练Scaling,或许不大
在GPT-5.2(大蒜)研发上,原爆料称,OpenAI解决了预训练环节遇到的一些关键问题——
改进之前“最好的”且“体量大得多”的预训练模型。
在内部,OpenAI整合了在开发“Shallotpeat”期间修复的Bug,积累了许多预训练的经验。
正如Information所言,最关键的突破发生在“预训练阶段”。
但以上的一切信息,都是新闻报道。OpenAI究竟在预训练上,是否实现了重大突破,难以得知。
但从官方全线击败Gemini 3基准上可以猜测,GPT-5.2在预训练方面取得了一定的改进。
但是从第三方评测和网友反馈中,GPT-5.2在底层技术迭代上,没有实现突破式的进展。Epoch AI另一项评估中,顶尖AI大模型在长程任务的性能,Gemini 3依旧是最强的——
[物价飞涨的时候 这样省钱购物很爽]
这条新闻还没有人评论喔,等着您的高见呢
OpenAI打出了GPT-5.2这张“年度王牌”,却没有打赢谷歌...
Epoch AI最新报告,GPT-5.2的能力指数(ECI)得分152,仅次于Gemini 3 Pro。
在多项基准测试中,GPT-5.2的实力并没有“全线霸榜”。
在由陶哲轩联手百位数学家出的考题——FrontierMath中,GPT-5.2仅在T1-3级中霸榜,T4还是Gemini 3的高地。
另外,在国际象棋Chess Puzzles中,GPT-5.2拿下了第一的成绩。
唯一例外的是,在SimpleQA Verified上,GPT-5.2都不及GPT-5.1,意味着迭代后的可信度更差了。
不仅如此,多个第三方基准评测显示,GPT-5.2远不及预期,没有打败Gemini 3。
包括OCR-Arena、simple-bench、Live-Bench上,GPT-5.2甚至都排在了Claude Opus 4.5之后。
发布仅两天,GPT-5.2水花不大,反而圈子里开发者吐槽的不少。
为了打赢这场硬仗,OpenAI拉响“红色警报”,把改进ChatGPT事项提到了优先级。
更极端的是,内部直接停掉了AGI的研发,Sora也暂停了八周,显然摆出了破釜沉舟的姿态。
可是呢,在业界来看,OpenAI至今仍未摆脱被动的局面。
GPT-5重度用户站出来发声,“GPT-5.2距离成为一块石头也不远了”。
年终之战,OpenAI败了?
三年前,谷歌因错失先机,被OpenAI ChatGPT抢尽了风头。
昨天,谷歌创始人谢尔盖·布林重返斯坦福演讲,现场公开承认曾经的“最大失误”:
我们搞砸了——太怕AI说错话,结果输掉一个时代。
如今,凭借Gemini 3 Pro+Nano Banana Pro,谷歌已重回AI浪潮之巅。
风水轮流转。这一次,轮到了OpenAI,却在2025年这场关键战役中自乱阵脚。
上线首日,奥特曼激动宣称,API调用量就超过了万亿token,且增长速度极快
此前Information爆料,GPT-5.2,代号大蒜(Garlic),原计划在明年初亮相。
整个硅谷,曾透露了一种风声——OpenAI预训练终结了,甚至GPT-5.1可能基于4o后训练而来,由此提升不大。
确实如此,在预训练上,OpenAI遇到了Scaling瓶颈。
预训练Scaling,或许不大
在GPT-5.2(大蒜)研发上,原爆料称,OpenAI解决了预训练环节遇到的一些关键问题——
改进之前“最好的”且“体量大得多”的预训练模型。
在内部,OpenAI整合了在开发“Shallotpeat”期间修复的Bug,积累了许多预训练的经验。
正如Information所言,最关键的突破发生在“预训练阶段”。
但以上的一切信息,都是新闻报道。OpenAI究竟在预训练上,是否实现了重大突破,难以得知。
但从官方全线击败Gemini 3基准上可以猜测,GPT-5.2在预训练方面取得了一定的改进。
但是从第三方评测和网友反馈中,GPT-5.2在底层技术迭代上,没有实现突破式的进展。Epoch AI另一项评估中,顶尖AI大模型在长程任务的性能,Gemini 3依旧是最强的——
[物价飞涨的时候 这样省钱购物很爽]
| 分享: |
| 注: | 在此页阅读全文 |
| 延伸阅读 |
推荐:
GPT-5.2降智遭全网差评!奥特曼慌了