最新顶级模型GPT-5.2已上线24小时:差评如潮!

2025-12-13 | 来源: 机器之心 | 有0人参与评论 | 字体: 放大缩小 | 收藏 | 打印

https://x.com/kyleichan/status/1999292461450166350?s=20

底下评论区也有不少人尝试，有网友试了三次，第一次和第三次用的是小写字母 r，第二次用了大写字母 R，第一次对了，第二次和第三次都错了。

总之，GPT-5.2 的回答很不稳定，有的回答正确，有的胡说八道。有网友推测，和上个版本一样…… 发布后的头几个小时确实很糟糕，但之后他们会修复问题，然后就能按预期运行了。

在官方贴出的基准测试中，GPT-5.2 在 AIME 2025（数学）的分数是 100%，但有网友故意「忽悠」GPT-5.2：所以 5.9-5.11=0.79。GPT-5.2 却回答：不，那不是小数的运算方式，5.11 比 5.9 大，因此 5.9-5.11=-0.21。这个傻狍子啊，被人一忽悠就忽悠瘸了。