一文读懂GPT-5发布会:价格屠夫、编程惊艳

北京时间8月8日凌晨1点的发布会上,GPT-5 总算在万众期待中姗姗而至,此时,距离GPT-4的发布已过去了两年半。


但这一次,比起ChatGPT 的惊艳亮相、GPT-4 的跨越式升级、o1 发布时的震撼全场,这场发布会显得格外平淡:不太惊艳的Benchmark,毫无新范式的影子;很难激起兴趣以及看出与竞品区别的用例展示;甚至还有被网友抓包的PPT展示错误,共同构成了这1小时20分钟的发布会。

但这并不意味着GPT-5没有进步。极低的幻觉率、前端能力的加强、上下文能力的跃升和极为有竞争力的价格,都是这次难得的亮点。

尤其是价格,在GPT-5精彩的编程表现之下,其API价格仅为昨天发布的Claude Opus 4.1的1/15,也比Gemini 2.5 Pro价格低。

这可以说是对Anthropic的致命一击。

今晚的OpenAI,虽失去了魔法的节奏、但依然在和其他厂商的肉搏中站稳了脚跟。

GPT-5本体:有限的升级、微末的SOTA

本次GPT-5共有4个版本,分为GPT-5 、 GPT-5 mini、 GPT-5 nano,以及只对企业版和每月 200 美元高级版开放的GPT-5 Pro模式。

对于一般用户而言,默认的是统一模型GPT-5,它是由多个模型组成的系统,包括用于大多数问题的“智能且快速”模型( gpt-5-main )和用于更复杂问题的“更深层推理”模型( gpt-5-thinking )。

这种统一的实现,是由一个实时路由器决定针对特定查询使用哪个模型。

mini、nano的具体选择则是API用户可选。而GPT-5Pro模式,则类似于Grok 4 Hard模式,使用了并行测试计算,一次多个模型一起并行计算更长时间。它用更大的算力,提供了最全面、最精准的答案。在超高难度的科学问题(GPQA)上,它刷新了世界纪录。在与人类专家的「盲测」中,10 次里有近 7 次被认为更优。

而在能力和评分上,GPT-5 几乎在每一项上都有提升,但都只比当下SOTA高了一点点,也只比o3强得很有限。


智力水平:体验最佳,但不是智力最佳

在智力的水平,各种主流评测集里,GPT-5都高于o3水平,但整体差距没有非常大。



细拆下来,其中提升最明显的前沿数学测试集里,我们能看到,GPT-5的效果还不如ChatGPT Agent,只有使用Pro模式下才会更强。



当与其他模型做比较时,我们就能发现,GPT-5大多数“智力”能力仅仅稍微高出竞争对手一点,部分能力甚至还并非SOTA,只能说整体以微小幅度领先。很难说是什么跨越式的能力提升。

[加西网正招聘多名全职sales 待遇优]
无评论不新闻,发表一下您的意见吧
注:
  • 新闻来源于其它媒体,内容不代表本站立场!
  • 在此页阅读全文
     延伸阅读
    纪念世界反法西斯战争胜利80周年,国新办发布会介绍《风与潮》等重大影视剧作品 2025「第三届北美中国茶冲泡大赛」发布会暨「温茶里」六周年庆典雅韵启幕
    小米举办15周年战略新品发布会 中国央行"十箭"齐发!发布会事关股市,楼市等 ...
    金秀贤否认翻车,与17岁金赛纶喝酒过夜,发布会痛哭只是鳄鱼眼泪 18年前大闹发布会现场的胡紫薇,后来怎样了?
    DeepSeek、中国国防费等 这场发布会信息量很大! 微短剧《她来自异世界》发布会圆满举行 开启跨次元奇异旅程
    中国手机荣耀发布"阿尔法战略及AI技术发布会" 两位华人坐镇Grok 3发布会C位,其中一人还是95后
     推荐:

    意见

    当前评论目前还没有任何评论,欢迎您发表您的看法。
    发表评论
    您的评论 *: 
    安全校验码 *:  请在此处输入图片中的数字
    The Captcha image  (请在此处输入图片中的数字)



    Copyright © 温哥华网, all rights are reserved.

    温哥华网为北美中文网传媒集团旗下网站