Warning: session_start(): open(/var/www/vhosts/vandaily.com/php_session/sess_f17dc72889d8118bfa7169a999bf671b, O_RDWR) failed: No space left on device (28) in /var/www/vhosts/vandaily.com/httpdocs/includes/session_new.php on line 34

Warning: mb_substr(): Unknown encoding "_CHARSET2" in /var/www/vhosts/vandaily.com/httpdocs/includes/classes/news_core.php on line 1908

Warning: mb_strlen(): Unknown encoding "_CHARSET2" in /var/www/vhosts/vandaily.com/httpdocs/includes/classes/news_core.php on line 1909

Warning: mb_strrpos(): Unknown encoding "_CHARSET2" in /var/www/vhosts/vandaily.com/httpdocs/includes/classes/news_core.php on line 1911

Warning: mb_strrpos(): Unknown encoding "_CHARSET2" in /var/www/vhosts/vandaily.com/httpdocs/includes/classes/news_core.php on line 1914
谷歌用AI"杀死"谷歌,这场发布会看得人缺氧 | 温哥华地产中心
   

[谷歌] 谷歌用AI"杀死"谷歌,这场发布会看得人缺氧

Gemini App 月活超 9 亿,月 Token 处理量每月 3200 万亿,Nano Banana 生成超过 500 亿张图片……


在今天凌晨刚刚结束的 Google I/O 大会上,Google CEO Demis Hassabis 上来就抛出了这些数字。

过去一年,AI 成了所有行业的主旋律,Gemini 在 Google 的定位,也开始从一个独一的 App,成了所有 Google 产品里的最重要的 AI 底层能力。

这次发布会也先从模型开始,进一步带到 Coding 和 Agent 产品。

Gemini Omni 把 Google 的视频生成推向「世界模型」方向,Gemini 3.5 Flash 则是和 AI 编程工具一起推向 Agent 开发平台。

这两个能力随后进入 Google 的完整生态,搜索、Gemini App、Flow、Spark、Chrome、XR 眼镜和电商场景。

Gemini Omni 登场,视频界的「Nano Banana」时刻来了

发布会最先被重点展开的是 Gemini Omni。我们做了一组和 Seedance 2.0 的对比视频,看看两者的差别。

Google 则是将 Gemini Omni 描述为一个能够「从任何输入创造任何内容」的新模型。

它把 Gemini 的推理能力与 Google 既有的生成式媒体模型结合起来,目标是提升模型对世界的理解、多模态生成能力和编辑能力。

Google 强调,Veo、Nano Banana、Genie 等模型已经能生成视频、图片和交互式模拟,但 Gemini Omni 更进一步,开始处理动能、重力等更接近物理世界的问题。

发布会现场展示的案例包括蛋白质折叠解释视频。用户只需要输入类似「生成一个关于蛋白质折叠的黏土动画解释」的提示,Omni 就能把抽象科学概念转化成视频内容。

它还支持更自然的视频编辑。用户可以上传自己的视频,再用对话方式修改风格、加入元素、调整细节,甚至把一个普通圆形转成黑洞,把夜晚散步场景变成更具戏剧感的画面。

Google 的说法是,Gemini Omni 先从视频开始,之后会逐步走向「任意输入到任意输出」。这也是 Google 一直把 Gemini 设计成多模态模型的原因。

首个 Omni 家族模型 Gemini Omni Flash 已在上线到 Google 产品中,Omni Pro 会在之后公布更多信息。Gemini App 中的 Omni 功能也面向 Google AI Plus、Pro 和 Ultra 订阅用户开放。

这意味着,Gemini Omni 不只是一个视频生成模型。Google 想把它放进「世界模型」的叙事里:模型不仅生成画面,还要理解画面中的物理关系、运动关系和场景逻辑。

在进入 Gemini App、Google Flow 和 YouTube Shorts 这些应用之后, Omni 也会让 Google 的生成式创作工具从图片编辑扩展到视频编辑。

Gemini 3.5 Flash 上线,AI 写代码进入极速模式


如果 Gemini Omni 对应的是生成和编辑,Gemini 3.5 Flash 对应的就是速度、成本和执行能力。

Google 在发布会上推出 Gemini 3.5 Flash,称它是 Gemini 3.5 系列第一批模型之一,重点面向 agentic coding、长周期任务和真实工作流。

相比 3.1 Pro,3.5 Flash 在几乎所有基准测试中提升明显,尤其是代码能力,以及 GDPVal 这类更接近真实经济任务的评测。

除了基准测试表现不错,3.5 Flash 在输出 tokens 速度上比其他前沿模型快 4 倍,在 Antigravity 中经过专门优化后,速度可达到 12 倍。

值得一提的是,今年 3 月,Google 内部开发相关任务每天处理约 5000 亿 tokens,之后每隔几周翻倍,目前已经超过每天 3 万亿 tokens。Google 把这称为一个反馈循环,用大规模真实使用继续改进 3.5 Flash。

与模型同步推出的是 Antigravity 2.0。

它从原来的 agent powered IDE,升级为一个独立桌面应用,重点转向 agent first。用户不再只是让 AI 在编辑器里辅助写代码,而是通过 Agent 对话、Agent 产物和多 Agent 协同来完成开发任务。

Antigravity 2.0 加入完整 CLI、Antigravity SDK、Gemini 音频模型原生语音支持,并集成 Android、Firebase、Google AI Studio 等服务。Antigravity 2.0 作为独立桌面应用,也已经面向全球用户开放。

[加西网正招聘多名全职sales 待遇优]
还没人说话啊,我想来说几句
Prev Page1234Next Page
Note:
  • 新闻来源于其它媒体,内容不代表本站立场!
  • _VIEW_NEWS_FULL
     延伸阅读 More...
    谷歌时隔十余年再推智慧眼镜 私隐问题仍受关注 谷歌150亿美元建数据中心,还帮居民交电费?
    谷歌推出最新AI模型,皮查伊要帮大客户年省10亿 Google开发者大会狂秀黑科技 5大重点一次看
    分析帐单....Google发布个人AI代理Spark 谷歌前CEO毕业典礼谈AI被狂嘘 反对者是"穴居人"?
    Google新功能曝光 即时翻译不用网络也能用 伊朗盯上海底电缆 威胁谷歌微软 恐引发"数位灾难"
    Gmail新账号重大改变 Google亲曝解方 美媒:谷歌已开始与SpaceX洽谈太空资料中心合作
     推荐:

    comments

    当前评论目前还没有任何评论,欢迎您发表您的看法。
    发表评论
    您的评论 *: 
    Security Code *:  Please input the number which is shown on the right picture
    The Captcha image  (Please input the number which is shown on the right picture)

    Copyright © 温哥华网, all rights are reserved.

    温哥华网为北美中文网传媒集团旗下网站