[谷歌] 谷歌全新AI模型Gemini 3发布:宣称"全球最智能模型"
随着Gemini 3模型智能能力的跃升,谷歌认为开发者体验正迎来一次被彻底重塑的机会。此次发布中,谷歌同步推出了面向未来“智能体开发环境”的Google Antigravity平台,让开发者能够以更高层次、更任务导向的方式进行软件构建。
借助Gemini 3的高级推理、工具使用能力与智能体编码(agentic coding)能力,Google Antigravity将AI从传统意义上“开发者工具箱中的一个工具”,提升为能够主动协作的开发伙伴。虽然 Antigravity的核心界面仍保留了AI IDE的常见形态,但平台为AI智能体提供了专属工作空间,并赋予其对编辑器、终端与浏览器的直接访问权限。开发者可以让这些智能体自主规划并执行复杂且端到端的软件任务,包括多步骤流程的并行执行与代码自我验证。
除了Gemini 3 Pro之外,Google Antigravity还与谷歌的Gemini 2.5 Computer Use(用于浏览器操作)以及图像编辑模型Nano Banana(Gemini 2.5 Image)深度集成,为自动化开发和跨工具操作提供更强支持。
规划能力:长链推理与自动化执行的大幅增强

Gemini 3在长链任务规划方面取得明显提升
在智能体能力不断增强的背景下,Gemini 3 在长链任务规划方面也取得了明显提升。谷歌指出,自Gemini 2引入“agentic”概念以来,团队持续强化模型的自主编码和任务执行能力,而Gemini 3则在更长时间尺度上的决策一致性上迈出关键一步。
在最新的Vending-Bench 2基准中,Gemini 3 Pro登顶榜首。该测试模拟经营一项自动售货机业务,要求模型在长达一年的虚拟运营周期内进行定价、补货、策略调整等决策。Gemini 3 Pro在整个过程中保持稳定的工具调用和策略一致性,不偏离任务目标,并最终获得明显高于其他前沿模型的整体收益。
谷歌表示,这意味着Gemini 3在现实生活中的“任务执行”能力也显着增强。通过更深的推理能力和更可靠的工具使用能力,模型能够在用户授权下完成更复杂的多步骤工作流,例如自动预订本地服务或整理电子邮箱,并从流程开始到结束保持连贯执行。
目前,Google AI Ultra用户已经可以在Gemini应用中试用这些智能体能力,包括由 Gemini Agent驱动的Gmail自动整理功能。谷歌称,随着相关能力不断完善,公司计划将其扩展至更多谷歌产品线。
附:Alphabet兼谷歌首席执行官桑达尔·皮查伊(Sundar Pichai)的寄语
将近两年前,谷歌开启了Gemini时代,这是公司有史以来规模最大、影响最深远的科学与产品项目之一。此后,用户对它的喜爱超出了预期。AI Overviews每月活跃用户已达20亿,Gemini应用月活跃用户超过6.5亿,超过70%的谷歌云客户正在使用我们的 AI 服务,已有1300万开发者基于我们的生成式模型进行开发。这些仅仅是我们观察到影响力的冰山一角。
凭借在AI创新方面的全栈优势,包括领先的基础设施、世界一流的研究、模型与工具链,以及触达全球数十亿用户的终端产品,我们得以以前所未有的速度将前沿能力推向全世界。
每一代Gemini都在前一代的基础上持续进化,使用户能够实现更多可能。Gemini 1 实现了原生多模态和超长上下文窗口的突破,极大拓展了可处理的信息种类与规模。Gemini 2为代理能力奠定基础,并在推理与思考维度上大幅提升,帮助用户应对更复杂的任务与想法。Gemini 2.5 Pro在LMArena榜单上连续六个月稳居榜首。
今天,我们正式推出Gemini 3,这一代模型是迄今为止最智能的Gemini,将系列所有能力融为一体,帮助用户将任何想法转化为现实。Gemini 3在推理能力上达到全新高度,能够深刻把握细微差别与深层含义,无论是捕捉创意中的微妙线索,还是剖析复杂问题的多层结构。
[物价飞涨的时候 这样省钱购物很爽]
这条新闻还没有人评论喔,等着您的高见呢
借助Gemini 3的高级推理、工具使用能力与智能体编码(agentic coding)能力,Google Antigravity将AI从传统意义上“开发者工具箱中的一个工具”,提升为能够主动协作的开发伙伴。虽然 Antigravity的核心界面仍保留了AI IDE的常见形态,但平台为AI智能体提供了专属工作空间,并赋予其对编辑器、终端与浏览器的直接访问权限。开发者可以让这些智能体自主规划并执行复杂且端到端的软件任务,包括多步骤流程的并行执行与代码自我验证。
除了Gemini 3 Pro之外,Google Antigravity还与谷歌的Gemini 2.5 Computer Use(用于浏览器操作)以及图像编辑模型Nano Banana(Gemini 2.5 Image)深度集成,为自动化开发和跨工具操作提供更强支持。
规划能力:长链推理与自动化执行的大幅增强

Gemini 3在长链任务规划方面取得明显提升
在智能体能力不断增强的背景下,Gemini 3 在长链任务规划方面也取得了明显提升。谷歌指出,自Gemini 2引入“agentic”概念以来,团队持续强化模型的自主编码和任务执行能力,而Gemini 3则在更长时间尺度上的决策一致性上迈出关键一步。
在最新的Vending-Bench 2基准中,Gemini 3 Pro登顶榜首。该测试模拟经营一项自动售货机业务,要求模型在长达一年的虚拟运营周期内进行定价、补货、策略调整等决策。Gemini 3 Pro在整个过程中保持稳定的工具调用和策略一致性,不偏离任务目标,并最终获得明显高于其他前沿模型的整体收益。
谷歌表示,这意味着Gemini 3在现实生活中的“任务执行”能力也显着增强。通过更深的推理能力和更可靠的工具使用能力,模型能够在用户授权下完成更复杂的多步骤工作流,例如自动预订本地服务或整理电子邮箱,并从流程开始到结束保持连贯执行。
目前,Google AI Ultra用户已经可以在Gemini应用中试用这些智能体能力,包括由 Gemini Agent驱动的Gmail自动整理功能。谷歌称,随着相关能力不断完善,公司计划将其扩展至更多谷歌产品线。
附:Alphabet兼谷歌首席执行官桑达尔·皮查伊(Sundar Pichai)的寄语
将近两年前,谷歌开启了Gemini时代,这是公司有史以来规模最大、影响最深远的科学与产品项目之一。此后,用户对它的喜爱超出了预期。AI Overviews每月活跃用户已达20亿,Gemini应用月活跃用户超过6.5亿,超过70%的谷歌云客户正在使用我们的 AI 服务,已有1300万开发者基于我们的生成式模型进行开发。这些仅仅是我们观察到影响力的冰山一角。
凭借在AI创新方面的全栈优势,包括领先的基础设施、世界一流的研究、模型与工具链,以及触达全球数十亿用户的终端产品,我们得以以前所未有的速度将前沿能力推向全世界。
每一代Gemini都在前一代的基础上持续进化,使用户能够实现更多可能。Gemini 1 实现了原生多模态和超长上下文窗口的突破,极大拓展了可处理的信息种类与规模。Gemini 2为代理能力奠定基础,并在推理与思考维度上大幅提升,帮助用户应对更复杂的任务与想法。Gemini 2.5 Pro在LMArena榜单上连续六个月稳居榜首。
今天,我们正式推出Gemini 3,这一代模型是迄今为止最智能的Gemini,将系列所有能力融为一体,帮助用户将任何想法转化为现实。Gemini 3在推理能力上达到全新高度,能够深刻把握细微差别与深层含义,无论是捕捉创意中的微妙线索,还是剖析复杂问题的多层结构。
[物价飞涨的时候 这样省钱购物很爽]
| 分享: |
| 注: | 在此页阅读全文 |
| 延伸阅读 | 更多... |
推荐: