[谷歌] Google大会一文读懂:用AI革自己的命
这意味着一个人就能完成过去 UI 设计师、前端工程师、测试工程师的流水线;也意味着在“可视化”与“可运行”之间,谷歌搭起了其他模型厂商尚未闭合的那截索桥。
这次更新中,明显可以谷歌找到了自己真正赢过其他竞对的“银弹”之一——多模态。

前一阵OpenAI 用 GPT-4o 的生图功能为OpenAI带来了相当大的流量。谷歌这次就用心的Imagen 4补齐,画面够精致,而且生成速度还是Imagen 3的十倍。

而更激进的是Veo 3 的发布,这个模型相当惊艳。除了AI视频生成更加逼真、统一外,它能一次性产出 1080p@60fps 画面与原生对白和音效,第一次以单一模型的形式给了画面声音。
这对于仍需“视频+后配音”的其他AI视频阵营而言,这是一次降维打击。

围绕 Veo 3,谷歌还推出 Flow,一个让创作者把 8 秒 AI 片段拖进时间线、即时拼接的“故事机器”。它可以把不同的素材(视频、图片等)组合进行编排、生成。用户可以控制镜头、一致性、还可以延展生成。这比起Sora的Story Board而言,更接近一套实用的剪辑工具。这套工具把AI后期剪辑的门槛从 Premiere 降到了普通用户可以使用的水平。

[物价飞涨的时候 这样省钱购物很爽]
好新闻没人评论怎么行,我来说几句
这次更新中,明显可以谷歌找到了自己真正赢过其他竞对的“银弹”之一——多模态。

前一阵OpenAI 用 GPT-4o 的生图功能为OpenAI带来了相当大的流量。谷歌这次就用心的Imagen 4补齐,画面够精致,而且生成速度还是Imagen 3的十倍。

而更激进的是Veo 3 的发布,这个模型相当惊艳。除了AI视频生成更加逼真、统一外,它能一次性产出 1080p@60fps 画面与原生对白和音效,第一次以单一模型的形式给了画面声音。
这对于仍需“视频+后配音”的其他AI视频阵营而言,这是一次降维打击。

围绕 Veo 3,谷歌还推出 Flow,一个让创作者把 8 秒 AI 片段拖进时间线、即时拼接的“故事机器”。它可以把不同的素材(视频、图片等)组合进行编排、生成。用户可以控制镜头、一致性、还可以延展生成。这比起Sora的Story Board而言,更接近一套实用的剪辑工具。这套工具把AI后期剪辑的门槛从 Premiere 降到了普通用户可以使用的水平。

[物价飞涨的时候 这样省钱购物很爽]
| 分享: |
| 注: | 在此页阅读全文 |
| 延伸阅读 | 更多... |
推荐: