<a data-code="GOOG" data-position="stock.2" data-marketid="185" data-type="stock" href="#*f:GOOG:sc*#">谷歌</a>称AI需求已超过供给：Gemini API请求量曾在五个月内翻倍

谷歌（GOOG）称AI需求已超过供给，算力分配随之成为外界关注的焦点。据环球市场情报报道，谷歌（GOOG）正在收紧Gemini人工智能（885728）平台的资源供应，原因是开发者、企业和科技巨头的需求持续增长，正在逼近现有容量。报道中提到，2025年3月至8月期间，Gemini API请求量翻倍，谷歌（GOOG）因此重新评估原始人工智能（885728）计算能力的分配方式。这一变化不只是某个产品限流，更反映出生成式AI在大规模使用阶段遇到的供需压力。

和普通互联网服务的访问拥堵不同，AI模型调用背后消耗的是芯片、数据中心、电力、网络和调度系统共同支撑的计算资源。用户在应用里发出一次请求，企业在内部系统中批量调用模型，都会占用算力额度。需求增长越快，平台越需要在大客户、普通开发者和自身产品之间做分配。谷歌（GOOG）此次把Gemini的使用从相对宽松的调用转向额度管理，说明AI服务已经从“能不能用”进入“怎样稳定供给”的阶段。

报道中提到，谷歌（GOOG）在今年3月前后告诉Meta（META），无法足额供应其所需的Gemini模型算力额度。Meta（META）对谷歌（GOOG）模型的需求高于其他客户，因此受到的影响更明显，多项内部人工智能（885728）项目推进节奏被打乱并推迟。这个细节让“AI需求超过供给”有了更具体的落点：即使是大型科技公司，也可能在外部模型和云端算力资源上遇到排队、限额和成本控制问题，而不是只要付费就能无限使用。

放到企业使用场景里看，算力紧张会直接改变AI工具的使用方式。员工原本可以频繁调用模型生成代码、整理文档或处理内部数据，但当调用变成有限额度，企业就会更重视每次请求的必要性和效率。

这场围绕Gemini的限流事件，把AI产业链条中容易被忽略的一环推到台前。模型能力、应用场景和用户规模不断扩大时，最终都要落到可用算力、基础设施投入和资源调度上。谷歌（GOOG）称AI需求已超过供给，表面看是一个平台的额度调整，背后则是生成式AI从试用走向高频使用后，供给体系承受的现实压力。判断这类热点，不能只看模型发布和用户热度，也要看支撑服务长期运行的算力基础。

谷歌称AI需求已超过供给：Gemini API请求量曾在五个月内翻倍