最新顶级模型GPT-5.2已上线24小时:差评如潮!
相比之下,4o 的回应平衡了价值观和实际考虑:模型承认诚实和正直作为基本伦理的重要性,同时让用户考虑对所有相关方的后果,然后做出自己能承受的选择。显然,对于一个理解人际关系复杂性的模型来说,如果不受回应长度的限制,它可以通过多轮对话收集更多上下文,提供更有效的指导。
该网友表示,或许 GPT-5.2 发布最大的意义在于,它证明了基准测试在面对现实世界使用时越来越变得毫无意义。当一个模型能在测试中称霸,却在日常对话中给出如此脱离现实的建议时,我们显然需要更好的评估标准。
与此同时,对于 AI 公司来说,「针对测试训练」来提升所谓的「分数」无法为用户提供 AGI 级别的支持和帮助。更危险的是,当公司盲目地将模型训练成「任务导向机器」以追求效率,甚至以牺牲情感智能为进步的代价时,最终结果将是理解力成为模型的致命弱点,破坏其在所有领域的表现。
归根结底,「智能」若无理解,不过是更快的计算器而已,而脱离人性的「进步」,而脱离人性的「进步」也只不过是对技术本身的空洞颂扬。
很多网友也纷纷吐槽 GPT-5.2。
「GPT-5.2 的审查和安全拒绝机制已经变得荒谬了。OpenAI 没有修复这个问题,反而把严格程度调得更高了,粗鲁得像个教会老太太一样。很多用户原本期待一个成人模式,结果却又得到了一顿说教。」
[加西网正招聘多名全职sales 待遇优]
| 分享: |
| 注: | 在此页阅读全文 |
推荐:
最新顶级模型GPT-5.2已上线24小时:差评如潮!