谷歌(GOOG)称AI需求已超过供给,算力分配随之成为外界关注的焦点。据环球市场情报报道,谷歌(GOOG)正在收紧Gemini人工智能(885728)平台的资源供应,原因是开发者、企业和科技巨头的需求持续增长,正在逼近现有容量。报道中提到,2025年3月至8月期间,Gemini API请求量翻倍,谷歌(GOOG)因此重新评估原始人工智能(885728)计算能力的分配方式。这一变化不只是某个产品限流,更反映出生成式AI在大规模使用阶段遇到的供需压力。
和普通互联网服务的访问拥堵不同,AI模型调用背后消耗的是芯片、数据中心、电力、网络和调度系统共同支撑的计算资源。用户在应用里发出一次请求,企业在内部系统中批量调用模型,都会占用算力额度。需求增长越快,平台越需要在大客户、普通开发者和自身产品之间做分配。谷歌(GOOG)此次把Gemini的使用从相对宽松的调用转向额度管理,说明AI服务已经从“能不能用”进入“怎样稳定供给”的阶段。
报道中提到,谷歌(GOOG)在今年3月前后告诉Meta(META),无法足额供应其所需的Gemini模型算力额度。Meta(META)对谷歌(GOOG)模型的需求高于其他客户,因此受到的影响更明显,多项内部人工智能(885728)项目推进节奏被打乱并推迟。这个细节让“AI需求超过供给”有了更具体的落点:即使是大型科技公司,也可能在外部模型和云端算力资源上遇到排队、限额和成本控制问题,而不是只要付费就能无限使用。
放到企业使用场景里看,算力紧张会直接改变AI工具的使用方式。员工原本可以频繁调用模型生成代码、整理文档或处理内部数据,但当调用变成有限额度,企业就会更重视每次请求的必要性和效率。
这场围绕Gemini的限流事件,把AI产业链条中容易被忽略的一环推到台前。模型能力、应用场景和用户规模不断扩大时,最终都要落到可用算力、基础设施投入和资源调度上。谷歌(GOOG)称AI需求已超过供给,表面看是一个平台的额度调整,背后则是生成式AI从试用走向高频使用后,供给体系承受的现实压力。判断这类热点,不能只看模型发布和用户热度,也要看支撑服务长期运行的算力基础。
