Agent时代的云计算(885362),正在被重新定义。
在5月20日阿里云峰会上,阿里云发布在AI与Agent原生云方向的技术架构演进与产品布局,以“Agentic Cloud"为战略,构建AI Native Cloud与Agent Native Cloud双层架构。
AI正在经历从“模型即产品”向“Agent即应用”的范式跃迁。模型需要更强的训练和推理基础设施来高效生产Token,而智能体则需要全新的云原生环境来承载其短生命周期(883436)、突发负载、动态的环境依赖等独特特征。
基于这一判断,阿里云将云计算(885362)基础设施划分为两大层面:AI Native Cloud聚焦于支持模型训练与Token生产,Agent Native Cloud则面向海量Agent应用的承载与运行,二者协同构成智能体时代的完整技术栈。
AI Native Cloud
支持模型训练与Token Plan
在AI Native Cloud层面,阿里云围绕“让模型更强、更快、更省”的目标,在训练和推理两个方向实现了系统性突破。
训练侧
模型训练更加看重算力集群的性能、扩展性与稳定性。智能计算灵骏已支持单集群双层十万卡规模,万卡线性扩展率超过96%;自研ChunkFlow框架训练性能提升453%,故障发现率超过98%。同时,阿里云推出Agentic RLVR训练框架,系统化构建Agent的任务理解与场景适配能力。
推理侧
阿里云从网络、KVCache、算力、调度四个维度协同优化。KVCache命中率达到90%以上,相较开源框架TTFT下降30%,TPS提升40%,并构建了从显存到系统内存、本地SSD再到高速远程存储的全局可寻址KVCache Store,实现多级存储与池化。
算力方面,真武 M890、真武 810E 及其他国产AI芯片,将通过智能计算灵骏提供服务,基于多地域的集群扩展能力,实现大规模异构推理。通过阿里云协同优化,GPU利用率从34%提升至48%。调度方面,推理引擎TTFT降低20.3%,TPS提升71%。
Agent Native Cloud
构成智能体时代的完整技术栈
在Agent Native Cloud层面,阿里云首次系统性定义了Agent Infrastructure的完整能力框架。当Agent成为主体负载,其短生命周期(883436)、无规律突发负载、动态环境依赖、任务级安全管控、大规模动态编排、复杂数据模态等六大特征对基础设施提出了全新挑战。阿里云以六大核心能力予以应对。
运行时层面
阿里云推出 FC/ACS Agent Sandbox,FC Sandbox支持百万并发,10万/min创建,1ms浅休眠/1s深休眠唤醒,5000并发(3GB异构镜像)无池化预热冷启动<1s;ACS Agent Sandbox 兼容 K8s 生态,企业可零改造复用现有基础设施,秒级沙箱启动,已大规模支撑 Agent RL 与 Serving 生产落地。
存储侧,EBS升级实现极速启动,云盘创建挂载耗时降90%,密度翻倍,快照预热加速镜像加载;每个Agent用独立云盘持久化,支持快照深休眠,成本降90%;在安全隔离上,独立云盘权限、容量、性能完全隔离,均支持加密。同时,Agent原生操作系统ANOLISA让帮助Token压缩节省30%消耗,并发会话数提升200%+,以内核级安全保障Skill完整性与访问隔离。
编排与治理层面
阿里云推出AgentTeams多Agent治理与协作平台,基于Leader-Worker架构实现多人多Agent协作;RocketMQ for AI以百万级LiteTopic构建Agent通信底座;构建Agent全生命周期(883436)治理链路AgentLoop,覆盖开发到进化全阶段,Agentic Judge以实验替代人工抽检,驱动智能体越用越聪明。
安全层面
阿里云推出Agent安全中心,统一管理Agent暴露面、身份和运行时安全,Agent ID Guard实现身份统一认证与细粒度权限管控,AI安全护栏2.0提供输入输出检测与防护以及实时动态行为监控。
记忆层面
阿里云PolarDB与RDS以本体论为基础,为AI Agents构建了数据语义层,支持自动本体建模、Agent分析Skill等,使Agent执行准确性提升65%,分析效率提升42%。此外,基于Tair的分层记忆架构统一管理短期、长期和知识记忆,语义缓存使成本降低81.5%、延迟降低80%。
数据平面层面
对象存储OSS正式推出Table Bucket(表格桶),形成了对象、向量、表格完整产品家族,为模型和Agent提供多源异构的数据底座,覆盖结构化、半结构化、非结构化和实时流数据的全生命周期(883436)管理。
阿里云发布Skills门户
与此同时,阿里云推动云产品控制面从面向人、面向程序向面向Agent的系统性升级,推出云Skills门户,通过Skills化、MCP化、CLI化三条路径实现标准化工(850102)具调用。目前阿里云已覆盖2万余个API,为300余款产品提供Skills全生命周期(883436)管理,并在skills.aliyun.com开源官方Skills。
阿里云核心产品全面推进
Agent化升级以及轻量化改造
在此基础上,阿里云在计算、存储、数据、安全、运维等核心产品线全面推进Agent化升级以及轻量化改造,OSS Agent实现多模态数据智能检索,准召率超过87%;瑶池数据库Agent已服务超过6000家企业;DataWorks Agent将ETL开发从数十小时降至分钟级;Agentic SOC实现安全运营自动驾驶,年均释放数百人天运营成本;STAROps全域智能运维平台将运维模式从被动响应推向主动自治,智能诊断3分钟定位根因并给出处置建议。
如果说AI Native Cloud是对算力底座的升级,那么Agent Native Cloud则是对云产品形态的一次根本性重塑。
通过AI Native Cloud持续提升模型能力与Token生产效率,通过Agent Native Cloud为海量智能体提供安全、弹性、可治理的运行环境,通过Agentic Products让每个云产品都具备被Agent调用的能力,阿里云正在构建一个从模型到Agent、从基础设施到应用生态的完整闭环,为智能体时代的大规模落地奠定坚实基础。
