I/O大会一文速览，新模型不是重点，谷歌要让AI进入一切

摘要：

AI开始“模拟现实”

“这是一个非凡的时刻。这是一个超高速发展的时期。”

北京时间5月20日凌晨，谷歌C（GOOG）EO Sundar Pichai在I/O大会上，用一句话定调了谷歌当前对AI行业的判断。在凤凰网科技看来，与其说这是一场技术发布会，不如说谷歌在向外界传递一个清晰的信号：当行业还在追逐参数榜时，谷歌已经把战火烧到了“世界模型”和“极致性价比”两条新赛道上了。

Gemini Omni正式登场：AI开始“模拟现实”

今天最值得关注的模型更新，不是某个跑分更高的文本模型，而是Gemini Omni。

谷歌将Omni定义为“世界模型”向前迈出的关键一步。用Pichai的话说，AI正从预测文本转向模拟现实，而Omni是第一个“可以从任何输入生成任何输出模态”的模型，这次率先落地的是视频输出。

谷歌DeepMind首席架构师Korai在讲解中放出了一段演示：给Omni一个简单的提示词“蛋白质折叠的解说”，模型直接生成了一段讲解蛋白质如何从氨基酸链折叠成α螺旋和β折叠、最终形成三维形状的视频。并且，这个视频还不是从素材库拼接的，而是基于模型在训练中积累的知识直接生成的。换句话说，Omni开始展现出对“直觉物理学”的理解——它没有在检索信息，而是在模拟现实世界的运行逻辑。

行业感到兴奋的是Omni在视频编辑上的能力。Korai演示了用户上传自己的视频后，Omni能基于音频、图像和视频等多种输入进行跨模态推理，然后自然地对角色、细节、风格进行改变。某种意义上看，这相当于把Nano Banana在图像编辑上重新定义规则的能力，完整复制到了视频领域。

Omni Flash将从本周二起向GOOGle AI订阅用户开放，用户可以在Gemini应用、GOOGle Photos和YouTube Shorts上体验。值得注意的是，所有由Omni创建或编辑的内容，都会被嵌入谷歌不可察觉的数字水印（886034），以应对急迫的安全伦理问题。Pichai同时宣布，OpenAI和ElevenLabs正在采用SynthID 2，这种跨行业合作在AI透明度议题上并不多见。

Gemini 3.5 Flash：一场针对成本的“闪电战”

如果说Omni是谷歌向未来的技术储备，那Gemini 3.5 Flash就是一把当下刺向市场痛点的快刀。

根据谷歌官方数据，3.5 Flash在几乎所有基准测试中都超越了上一代旗舰模型3.1 Pro，编码能力尤其进步巨大，在衡量现实经济价值任务的GDP Val基准上实现了“非凡飞跃”。但真正的杀伤力不在跑分。

Pichai在台上给出了一组清晰的对比：3.5 Flash的智能处于前沿水平，几乎与市面上最好的模型持平，但它的输出速度是其他前沿模型的四倍。在谷歌内部为Anti Gravity（GRVY）平台优化后，速度优势甚至拉大到12倍。

实际上，这种组合应用在谷歌内部直接改变了游戏（881275）规则。

速度背后是成本逻辑。Pichai罕见地替企业CIO算了一笔账：“我听到很多CIO说公司快用完年度Token预算了。假如他们拿出80%的工作负载从别家模型切换到3.5 Flash，一年能省超过10亿美元。”这种用真金白银做武器的话术，等于向企业市场直接摊牌：谷歌要走量、要规模、要用性价比清场。

支撑这种性价比的，也逃不开谷歌自研的第八代TPU。这次谷歌首次采用双芯片设计（CPU 80和8 I），为训练和推理分别优化架构。更重要的是，谷歌通过多机多任务训练框架“Pathways”技术，将训练分布到全球超过100万个TPU上，创建了全球最大的训练集群。Korai透露了一个内部数据：今年3月谷歌内部每天处理0.5万亿Token，现在已飙升至每天超过3万亿Token，几周就翻一番。这种内部大规模使用形成的反馈闭环，正是把成本不断压低的核心引擎。

生态卡位：从开发者到购物车，全面“包围”

模型之外，谷歌今天展示的生态系统打法同样值得深究。

在开发者侧，谷歌发布了Anti Gravity（GRVY） 2.0，一个独立桌面应用，可以让用户编排多个ai智能体（886099）并行完成任务：一个写网站代码，一个生成品牌素材，一个做产品架构。同时推出的还有命令行界面和SDK，等于给了程序员与谷歌自身产品同等能力的智能体工具包。

在安全领域，谷歌展示了一款名为Covenant的工具，能利用Gemini模型自动查找并直接修补代码漏洞，而不只是发现。这显然是在瞄准大型企业对安全自动化日益增长的需求。

但真正能让谷歌流量入口继续坐稳的，是搜索和购物体验的改造。

搜索负责人Liz Reid确认，AI Mode模型已升级至3.5 Flash。一组数据佐证了这种AI搜索的势能：AI Overviews月活超25亿，AI Mode推出仅一年月活破10亿，搜索查询量在上季度达到历史最高点。谷歌顺势推出了25年来最大的一次搜索框升级，支持更长的对话式查询和AI驱动的建议系统，并将从夏季开始允许用户创建在后台7×24小时工作的“信息智能体”。

购物场景的野心更大。谷歌商务负责人Vidhya展示了“Universal（UEIC） Card”智能购物车，能跨设备、跨商家运作：用户可以在搜索、YouTube、Gmail中随时添加商品，购物车在后台自动查优惠、监控降价、补货提醒，甚至能根据用户钱包里的多张银行卡，自动计算用哪张卡结算最划算。配合已获得亚马逊（AMZN）、Meta（META）、微软（MSFT）等支持的通用商务协议（UCP）和保障支付的AP2协议，谷歌正在搭建一个让ai智能体（886099）安全花钱的完整商业闭环。

在个人助手层面，全新的Gemini Spark定位为7×24小时运行在云端的个人ai智能体（886099）。比较可怕的是，即使你关掉电脑或手机，它仍在后台继续完成任务。Spark将首先面向可信测试者开放，随后以每月100美元的新Ultra套餐价格推出。

看完这场发布会的全部内容，我们的一个核心感受是：谷歌已经不再把AI当成单一的产品竞赛，而是把它变成了一个从芯片到模型、从开发者到消费（883434）者、从搜索到购物的全栈战争。用Omni去定义“理解世界”的技术上限，用3.5 Flash去打穿商业化的价格底线，再用搜索、地图、购物、邮件等国民级应用完成场景收割——这套组合拳的背后，是谷歌对自己规模优势的最大化利用。

当然，挑战同样清晰。Spark智能体能否跨过用户隐私和信任的门槛？Omni的视频生成能力在开放后能否守住安全边界？这些问题的答案，将决定谷歌这盘AI大棋的终局成色。

问财摘要