谷歌 Gemini 3 深夜炸场:没有悬念的最强 AI

[谷歌] 谷歌 Gemini 3 深夜炸场:没有悬念的最强 AI

2025-11-20 | 来源: Li Yuan | 有0人参与评论 | 字体: 放大缩小 | 收藏 | 打印

有一个很有趣的标准也被 Google 挂了上来：在一个模拟开店赚钱的基准 Vending-Bench 2 上，Gemini 3 Pro 最终赚取了$5,478.16的净资产，而 GPT-5.1 仅赚了 $1,473.43。

不过关于之前网传“彻底端到端终结程序员”的编程能力，Gemini 3 Pro 的状态是在 AI 届顶尖，但并没有“颠覆编程”。

在衡量软件工程能力的SWE-Bench Verified测试中，Gemini 3 Pro 得分为76.2%，虽然很强，但并未超越 Claude Sonnet 4.5（77.2%）拿到 SOTA。这意味着在处理超长程、极其复杂的后端逻辑时，它依然有局限性。

这也很合理。每一个大模型目前都在全力卷编程的情况下，想要在这个领域一骑绝尘确实比较难。

目前 Gemini 的能力更偏向于，还不能帮你重构整个后端架构，但如果你想写一个极具现代设计美学的网站、一个 3D 飞船游戏，或者生成复杂的 SVG 交互动画，它能通过一次提示就给出极其惊艳的、可直接运行的结果。

02 Antigravity，Agentic 编程的探索

有了最强的模型和算力，谷歌开始在应用层“掀桌子”了。今晚，谷歌扔出了一个“小王炸”——Google Antigravity。

前一阵新闻的风向还是模型公司努力收购 AI 编程应用公司呢，而 Google 这次则这么快的就发了自己的开发平台。

这不仅仅是一个新的 IDE，它是谷歌定义的Agent-first（智能体优先）开发平台。在这里，开发者从“码农”升级为“架构师”，而 Gemini 3 化身为拥有编辑器、终端和浏览器完整权限的“执行合伙人”。

为了达成这种体验，谷歌甚至在后台配置了一个“模型军团”协同作战：Gemini 3：作为大脑，负责高级推理和代码编写。

Gemini 2.5 Computer Use：作为手眼，专门控制浏览器进行 UI 验证和测试。

Nano Banana：作为美工，负责生成图像和 UI 素材。这种打通了底层模型到顶层交互的闭环体验，对于 Cursor 等现有 AI 编辑器来说，无疑是一次降维打击。

Antigravity 最有趣的能力在于并行。官方材料明确提到，开发者可以与多个智能 Agent 协作，而这些 Agent 能够代表你同时自主规划并执行复杂的端到端软件任务。

想象一下这种工作流：你下达一个指令，Antigravity 瞬间分裂出多个 Agent——Agent A 负责写后端逻辑，Agent B 负责在终端跑测试用例，Agent C 直接打开浏览器去验证前端 UI 的交互效果。它们并行不悖，像是一个配合默契的敏捷开发小组，而你只需要验收它们提交的“工件”。

Antigravity 是是一个免费平台，网络上目前对于 Antigravity 的使用体验不多，但基本上都是好评。

要达到替代 Cursor 本身，肯定不太行——端到端的复杂编程体验，肯定还需要模型更成熟。但是简单的项目进行编程，或许会更简单了。

03 全家桶齐发力：TPU 与搜索

在大模型发展的后半程，比拼的不再是单一算法的灵光一闪，而是谁的算力更冗余、谁的数据更广阔、谁的投入更持久。Gemini 3 Pro 的胜利，有一点是很特别的：

Gemini 3 Pro 是使用 Google TPU 训练的。

当全世界的 AI 公司都在苦苦等待英伟达 GPU 的发货周期时，谷歌依然坐在自家庞大的 TPU 矿山上。TPU 专为 LLM 训练设计，拥有极高的高带宽内存（HBM），这让它能够轻松处理海量的模型参数和超大的 Batch Size。正是 TPU 的算力冗余，给了 Gemini 3 Pro 肆意扩张参数规模的底气。

[物价飞涨的时候这样省钱购物很爽] 好新闻没人评论怎么行，我来说几句

分享:

注：

新闻来源于其它媒体，内容不代表本站立场！

在此页阅读全文

意见

当前评论目前还没有任何评论，欢迎您发表您的看法。

发表评论

专家专栏

工具

当前会员

[谷歌] 谷歌 Gemini 3 深夜炸场:没有悬念的最强 AI

意见