一文读懂GPT-5发布会:价格屠夫、编程惊艳
但这一次,比起ChatGPT 的惊艳亮相、GPT-4 的跨越式升级、o1 发布时的震撼全场,这场发布会显得格外平淡:不太惊艳的Benchmark,毫无新范式的影子;很难激起兴趣以及看出与竞品区别的用例展示;甚至还有被网友抓包的PPT展示错误,共同构成了这1小时20分钟的发布会。
但这并不意味着GPT-5没有进步。极低的幻觉率、前端能力的加强、上下文能力的跃升和极为有竞争力的价格,都是这次难得的亮点。
尤其是价格,在GPT-5精彩的编程表现之下,其API价格仅为昨天发布的Claude Opus 4.1的1/15,也比Gemini 2.5 Pro价格低。
这可以说是对Anthropic的致命一击。
今晚的OpenAI,虽失去了魔法的节奏、但依然在和其他厂商的肉搏中站稳了脚跟。
GPT-5本体:有限的升级、微末的SOTA
本次GPT-5共有4个版本,分为GPT-5 、 GPT-5 mini、 GPT-5 nano,以及只对企业版和每月 200 美元高级版开放的GPT-5 Pro模式。
对于一般用户而言,默认的是统一模型GPT-5,它是由多个模型组成的系统,包括用于大多数问题的“智能且快速”模型( gpt-5-main )和用于更复杂问题的“更深层推理”模型( gpt-5-thinking )。
这种统一的实现,是由一个实时路由器决定针对特定查询使用哪个模型。
mini、nano的具体选择则是API用户可选。而GPT-5Pro模式,则类似于Grok 4 Hard模式,使用了并行测试计算,一次多个模型一起并行计算更长时间。它用更大的算力,提供了最全面、最精准的答案。在超高难度的科学问题(GPQA)上,它刷新了世界纪录。在与人类专家的「盲测」中,10 次里有近 7 次被认为更优。
而在能力和评分上,GPT-5 几乎在每一项上都有提升,但都只比当下SOTA高了一点点,也只比o3强得很有限。
智力水平:体验最佳,但不是智力最佳
在智力的水平,各种主流评测集里,GPT-5都高于o3水平,但整体差距没有非常大。

细拆下来,其中提升最明显的前沿数学测试集里,我们能看到,GPT-5的效果还不如ChatGPT Agent,只有使用Pro模式下才会更强。

当与其他模型做比较时,我们就能发现,GPT-5大多数“智力”能力仅仅稍微高出竞争对手一点,部分能力甚至还并非SOTA,只能说整体以微小幅度领先。很难说是什么跨越式的能力提升。
[加西网正招聘多名全职sales 待遇优]
分享: |
注: | 在此页阅读全文 |
延伸阅读 |
推荐: