[谷歌] 谷歌 Gemini 3 深夜炸場:沒有懸念的最強 AI
來了。
預熱了快壹個月的 Gemini 3 Pro,就在剛剛,正式在 Google AI Studio 上線 Preview 版,API 也同步開放。接下來將陸續上線Google的各項產品中。
沒有任何多余的廢話,打開 Model Card,滿眼寫著的只有兩個字:碾壓。
按照 Google 披露的測試數據,Gemini 3 Pro 毫無懸念地成為了目前地球上數學最強的 AI。在數學競賽的“地獄模式”MathArena 裡,當包括 GPT-5.1 在內的其他大模型還在 1% 上下掙扎時,Gemini 3 Pro 直接幹到了23.4%。
編程能力方面,雖然在 SWE-Bench 上未拿 SOTA——但絕對屬於第壹梯隊。Live Code Bench 的 Elo 得分超過 2400 分 ,在工具調用和終端操作基准測試中更是名列第壹。
真正炸裂的是它的“視覺智能”。
對屏幕截圖的理解能力高達72.7%,是目前最先進水平的兩倍。這意味著 Agent 不再是瞎子,它將徹底重塑 AI 操作計算機的模式。

但這還沒完,Google 今晚還順手扔出了壹個小王炸:自家的 Agentic 編程平台——Google Antigravity。
此前網傳 Gemini 3 能實現“端到端編程”,大家以為是模型成精了。但看起來,並不是模型成精,而是 Google 正在探索如何用更好的系統工程實現端到端編程。
如果說 Cursor 是目前最強的“外骨骼”,它通過 AI 補全讓你寫代碼更快;那 Antigravity 就是奔著“自動駕駛”去的。它不再只是壹個編輯器,而是壹個智能體優先(Agent-first)發環境。集成了 Gemini 3 和能操控瀏覽器的 Gemini 2.5 Computer Use 模型,它的 Agent 能自己寫代碼、自己開終端跑測試、甚至自己打開瀏覽器驗證 UI,發現報錯自己修。
不講故事,只拼肌肉。
Google 用這壹波硬核發布宣告:新王已至。
有趣的是,這次連 Sam Altman 都獻上了自己的點贊。:)

01 霸榜的暴力美學:不止是智商洗榜,更是 Agent 能力的變化
在 AI 圈子裡,大家習慣了模型之間你追我趕的微弱優勢,但 Gemini 3 Pro 拋出的這份成績單,可以說拾分耀眼。
根據 Model Card 披露的數據,Gemini 3 Pro 在推理、多模態、Agent 工具使用等關鍵基准上,實現了全方位的霸榜。

[物價飛漲的時候 這樣省錢購物很爽]
好新聞沒人評論怎麼行,我來說幾句
預熱了快壹個月的 Gemini 3 Pro,就在剛剛,正式在 Google AI Studio 上線 Preview 版,API 也同步開放。接下來將陸續上線Google的各項產品中。
沒有任何多余的廢話,打開 Model Card,滿眼寫著的只有兩個字:碾壓。
按照 Google 披露的測試數據,Gemini 3 Pro 毫無懸念地成為了目前地球上數學最強的 AI。在數學競賽的“地獄模式”MathArena 裡,當包括 GPT-5.1 在內的其他大模型還在 1% 上下掙扎時,Gemini 3 Pro 直接幹到了23.4%。
編程能力方面,雖然在 SWE-Bench 上未拿 SOTA——但絕對屬於第壹梯隊。Live Code Bench 的 Elo 得分超過 2400 分 ,在工具調用和終端操作基准測試中更是名列第壹。
真正炸裂的是它的“視覺智能”。
對屏幕截圖的理解能力高達72.7%,是目前最先進水平的兩倍。這意味著 Agent 不再是瞎子,它將徹底重塑 AI 操作計算機的模式。

但這還沒完,Google 今晚還順手扔出了壹個小王炸:自家的 Agentic 編程平台——Google Antigravity。
此前網傳 Gemini 3 能實現“端到端編程”,大家以為是模型成精了。但看起來,並不是模型成精,而是 Google 正在探索如何用更好的系統工程實現端到端編程。
如果說 Cursor 是目前最強的“外骨骼”,它通過 AI 補全讓你寫代碼更快;那 Antigravity 就是奔著“自動駕駛”去的。它不再只是壹個編輯器,而是壹個智能體優先(Agent-first)發環境。集成了 Gemini 3 和能操控瀏覽器的 Gemini 2.5 Computer Use 模型,它的 Agent 能自己寫代碼、自己開終端跑測試、甚至自己打開瀏覽器驗證 UI,發現報錯自己修。
不講故事,只拼肌肉。
Google 用這壹波硬核發布宣告:新王已至。
有趣的是,這次連 Sam Altman 都獻上了自己的點贊。:)

01 霸榜的暴力美學:不止是智商洗榜,更是 Agent 能力的變化
在 AI 圈子裡,大家習慣了模型之間你追我趕的微弱優勢,但 Gemini 3 Pro 拋出的這份成績單,可以說拾分耀眼。
根據 Model Card 披露的數據,Gemini 3 Pro 在推理、多模態、Agent 工具使用等關鍵基准上,實現了全方位的霸榜。

[物價飛漲的時候 這樣省錢購物很爽]
| 分享: |
| 注: | 在此頁閱讀全文 |
| 延伸閱讀 | 更多... |
推薦: