同花顺 Logo
AIME助手
问财助手
I/O大会一文速览,新模型不是重点,谷歌要让AI进入一切
2026-05-20 08:10:03
来源:凤凰网
作者:凤凰网科技
分享
AIME

问财摘要

1、谷歌CEO Sundar Pichai在I/O大会上表示,AI正从预测文本转向模拟现实,谷歌将Omni定义为“世界模型”向前迈出的关键一步。Omni可以从任何输入生成任何输出模态,率先落地的是视频输出。 2、谷歌还推出了Gemini 3.5 Flash,它在几乎所有基准测试中都超越了上一代旗舰模型3.1 Pro,输出速度是其他前沿模型的四倍。 3、谷歌通过自研的第八代TPU和多机多任务训练框架“Pathways”技术,将训练分布到全球超过100万个TPU上,创建了全球最大的训练集群,从而实现了极致性价比。 4、谷歌展示了Anti Gravity 2.0、Covenant等工具,以及“Universal Card”智能购物车,将AI智能体工具包应用于更广泛的领域。
免责声明 内容由AI生成
文章提及标的
谷歌C--
数字水印--
Gravity--
游戏--
AI智能体--
亚马逊--

摘要:

AI开始“模拟现实”

“这是一个非凡的时刻。这是一个超高速发展的时期。”

北京时间5月20日凌晨,谷歌C(GOOG)EO Sundar Pichai在I/O大会上,用一句话定调了谷歌当前对AI行业的判断。在凤凰网科技看来,与其说这是一场技术发布会,不如说谷歌在向外界传递一个清晰的信号:当行业还在追逐参数榜时,谷歌已经把战火烧到了“世界模型”和“极致性价比”两条新赛道上了。

Gemini Omni正式登场:AI开始“模拟现实”

今天最值得关注的模型更新,不是某个跑分更高的文本模型,而是Gemini Omni。

谷歌将Omni定义为“世界模型”向前迈出的关键一步。用Pichai的话说,AI正从预测文本转向模拟现实,而Omni是第一个“可以从任何输入生成任何输出模态”的模型,这次率先落地的是视频输出。

谷歌DeepMind首席架构师Korai在讲解中放出了一段演示:给Omni一个简单的提示词“蛋白质折叠的解说”,模型直接生成了一段讲解蛋白质如何从氨基酸链折叠成α螺旋和β折叠、最终形成三维形状的视频。并且,这个视频还不是从素材库拼接的,而是基于模型在训练中积累的知识直接生成的。换句话说,Omni开始展现出对“直觉物理学”的理解——它没有在检索信息,而是在模拟现实世界的运行逻辑。

行业感到兴奋的是Omni在视频编辑上的能力。Korai演示了用户上传自己的视频后,Omni能基于音频、图像和视频等多种输入进行跨模态推理,然后自然地对角色、细节、风格进行改变。某种意义上看,这相当于把Nano Banana在图像编辑上重新定义规则的能力,完整复制到了视频领域。

Omni Flash将从本周二起向GOOGle AI订阅用户开放,用户可以在Gemini应用、GOOGle Photos和YouTube Shorts上体验。值得注意的是,所有由Omni创建或编辑的内容,都会被嵌入谷歌不可察觉的数字水印(886034),以应对急迫的安全伦理问题。Pichai同时宣布,OpenAI和ElevenLabs正在采用SynthID 2,这种跨行业合作在AI透明度议题上并不多见。

Gemini 3.5 Flash:一场针对成本的“闪电战”

如果说Omni是谷歌向未来的技术储备,那Gemini 3.5 Flash就是一把当下刺向市场痛点的快刀。

根据谷歌官方数据,3.5 Flash在几乎所有基准测试中都超越了上一代旗舰模型3.1 Pro,编码能力尤其进步巨大,在衡量现实经济价值任务的GDP Val基准上实现了“非凡飞跃”。但真正的杀伤力不在跑分。

Pichai在台上给出了一组清晰的对比:3.5 Flash的智能处于前沿水平,几乎与市面上最好的模型持平,但它的输出速度是其他前沿模型的四倍。在谷歌内部为Anti Gravity(GRVY)平台优化后,速度优势甚至拉大到12倍。

实际上,这种组合应用在谷歌内部直接改变了游戏(881275)规则。

速度背后是成本逻辑。Pichai罕见地替企业CIO算了一笔账:“我听到很多CIO说公司快用完年度Token预算了。假如他们拿出80%的工作负载从别家模型切换到3.5 Flash,一年能省超过10亿美元。”这种用真金白银做武器的话术,等于向企业市场直接摊牌:谷歌要走量、要规模、要用性价比清场。

支撑这种性价比的,也逃不开谷歌自研的第八代TPU。这次谷歌首次采用双芯片设计(CPU 80和8 I),为训练和推理分别优化架构。更重要的是,谷歌通过多机多任务训练框架“Pathways”技术,将训练分布到全球超过100万个TPU上,创建了全球最大的训练集群。Korai透露了一个内部数据:今年3月谷歌内部每天处理0.5万亿Token,现在已飙升至每天超过3万亿Token,几周就翻一番。这种内部大规模使用形成的反馈闭环,正是把成本不断压低的核心引擎。

生态卡位:从开发者到购物车,全面“包围”

模型之外,谷歌今天展示的生态系统打法同样值得深究。

在开发者侧,谷歌发布了Anti Gravity(GRVY) 2.0,一个独立桌面应用,可以让用户编排多个ai智能体(886099)并行完成任务:一个写网站代码,一个生成品牌素材,一个做产品架构。同时推出的还有命令行界面和SDK,等于给了程序员与谷歌自身产品同等能力的智能体工具包。

在安全领域,谷歌展示了一款名为Covenant的工具,能利用Gemini模型自动查找并直接修补代码漏洞,而不只是发现。这显然是在瞄准大型企业对安全自动化日益增长的需求。

但真正能让谷歌流量入口继续坐稳的,是搜索和购物体验的改造。

搜索负责人Liz Reid确认,AI Mode模型已升级至3.5 Flash。一组数据佐证了这种AI搜索的势能:AI Overviews月活超25亿,AI Mode推出仅一年月活破10亿,搜索查询量在上季度达到历史最高点。谷歌顺势推出了25年来最大的一次搜索框升级,支持更长的对话式查询和AI驱动的建议系统,并将从夏季开始允许用户创建在后台7×24小时工作的“信息智能体”。

购物场景的野心更大。谷歌商务负责人Vidhya展示了“Universal(UEIC) Card”智能购物车,能跨设备、跨商家运作:用户可以在搜索、YouTube、Gmail中随时添加商品,购物车在后台自动查优惠、监控降价、补货提醒,甚至能根据用户钱包里的多张银行卡,自动计算用哪张卡结算最划算。配合已获得亚马逊(AMZN)Meta(META)微软(MSFT)等支持的通用商务协议(UCP)和保障支付的AP2协议,谷歌正在搭建一个让ai智能体(886099)安全花钱的完整商业闭环。

在个人助手层面,全新的Gemini Spark定位为7×24小时运行在云端的个人ai智能体(886099)。比较可怕的是,即使你关掉电脑或手机,它仍在后台继续完成任务。Spark将首先面向可信测试者开放,随后以每月100美元的新Ultra套餐价格推出。

看完这场发布会的全部内容,我们的一个核心感受是:谷歌已经不再把AI当成单一的产品竞赛,而是把它变成了一个从芯片到模型、从开发者到消费(883434)者、从搜索到购物的全栈战争。用Omni去定义“理解世界”的技术上限,用3.5 Flash去打穿商业化的价格底线,再用搜索、地图、购物、邮件等国民级应用完成场景收割——这套组合拳的背后,是谷歌对自己规模优势的最大化利用。

当然,挑战同样清晰。Spark智能体能否跨过用户隐私和信任的门槛?Omni的视频生成能力在开放后能否守住安全边界?这些问题的答案,将决定谷歌这盘AI大棋的终局成色。

免责声明:风险提示:本文内容仅供参考,不代表同花顺观点。同花顺各类信息服务基于人工智能算法,如有出入请以证监会指定上市公司信息披露平台为准。如有投资者据此操作,风险自担,同花顺对此不承担任何责任。
homeBack返回首页
不良信息举报与个人信息保护咨询专线:10100571违法和不良信息涉企侵权举报涉算法推荐举报专区涉青少年不良信息举报专区

浙江同花顺互联信息技术有限公司版权所有

网站备案号:浙ICP备18032105号-4
证券投资咨询服务提供:浙江同花顺云软件有限公司 (中国证监会核发证书编号:ZX0050)
AIME
举报举报
反馈反馈