GPT-5.2获封"最强打工人" Gemini"性价比"系列应战




图片由AI生成

“我从未像现在这样对我们的研发和产品路线图,以及实现我们使命的整体方向感到如此乐观。”

12月12日,在正式上线GPT-5.2的同时,OpenAI CEO萨姆·奥尔特曼(Sam Altman)发布了一篇十周年纪念文章中这样说。

他极力向外界展现着自己依旧自信的一面。毕竟,虽然GPT大模型和ChatGPT聊天机器人至今仍是当前AI大潮的造浪者,但想必此刻,奥尔特曼感受到的竞争压力堪称空前。

今年以来,DeepSeek、Grok、Claude等竞争者的强势追赶,尤其是谷歌上个月推出的Gemini 3大放异彩,都将AI大模型竞争推上了更新的高度。

最近,奥尔特曼先是在内部备忘录中提示员工,需要接受最好的大模型不出自家之手的事实,继而,又发出公司首个“红色警报”,强调“立即行动,集中所有资源夺回领先地位”。



截图来自社交平台X

只有更强大的产品,才能支撑自信的底气。

在十周年纪念日这天,OpenAI重磅发布预热了一周多的GPT-5.2,评测表现再次反超所有竞争对手。

但谷歌不甘示弱,几乎在同一时间发布了新品,让这场大模型之争的战况再次升级。

GPT-5.2获评“最强AI打工人”,但“工资”很高


GPT-5.2此次仍然“全线出击”,一次性发布了Instant、Thinking和Pro三款不同层级的模型。

近一个月前Gemini 3发布时,其评测得分几乎“碾压”GPT-5的表现引发市场巨大关注。

而这次,根据OpenAI发布的基准测试结果,GPT-5.2实现了全面反超,其Thinking模型基准测试得分均高于Gemini 3 PRO和Anthropic的Claude Opus 4.5。

其中,GPT-5.2在博士级别的专家推理评估GPQA Diamond得分高达92.4%,相比GPT-5.1 Thinking的88.1%和Gemini 3 PRO刚刚刷出的91.9%高分再进一步。在不用工具的情况下,GPT-5.2在最新美国数学邀请赛(AIME2025)中拿到了满分。

OpenAI尤其强调了GPT-5.2在专业工作方面的领先地位,称其Thinking模型是“目前最能够胜任现实中各类专业用途的模型”。

在用于评估专业型技能的GDPval测试中,该模型得到了70.9%的高分,比GPT-5.1 Thinking高了足足32.1%,领先Gemini 3 PRO有17.4%。此外,对比尤其擅长编程等企业工作,此前在该评估中更胜一筹的Claude Opus 4.5,OpenAI的新品也高出了11.3%。

[物价飞涨的时候 这样省钱购物很爽]
这条新闻还没有人评论喔,等着您的高见呢
上一页123下一页
注:
  • 新闻来源于其它媒体,内容不代表本站立场!
  • 在此页阅读全文
     延伸阅读
    读完8家顶级投行的2026展望,Gemini给总结 Google Gemini最新功能曝光 画圈搜寻落伍了
    Google首席AI架构师:Gemini 逆风翻盘有18个关键 用了两天谷歌Gemini 3 感觉它彻底疯狂了
    谷歌 Gemini 3 深夜炸场:没有悬念的最强 AI Gemini 3获盛赞 谷歌股价一度涨近7% 创历史新高
    Gemini对阵ChatGPT,谁能辨出12段视频真假? 谷歌全新AI模型Gemini 3发布:宣称"全球最智能模型"
    传Google新一代Gemini下周登场(图 录音一秒生成文字 Gemini App解锁新功能
     推荐:

    意见

    当前评论目前还没有任何评论,欢迎您发表您的看法。
    发表评论
    您的评论 *: 
    安全校验码 *:  请在此处输入图片中的数字
    The Captcha image  (请在此处输入图片中的数字)



    Copyright © 温哥华网, all rights are reserved.

    温哥华网为北美中文网传媒集团旗下网站