导语
过去两年,行业追逐的是更强的模型。但当大模型进入真实业务后,问题变了——如何持续、稳定、低成本地输出Token。行业正从“模型时代”走向“Token时代”。
AI产业正在经历一次历史性延展:从模型服务能力,延展到基础设施运营服务能力。
范式转移:从模型到Token
模型厂商负责“造脑”,Token工厂负责把模型能力转化为可规模化、可SLA保障、可计量的智能服务。两者分工清晰,共同构成从模型能力到产业应用的完整闭环。
软通动力(301236)选择做Token工厂,是二十年积累的自然延伸。
过去二十年,软通动力(301236)持续服务互联网、运营商、金融、能源(850101)、工业制造等政企行业客户,深度参与其核心业务支撑系统的建设与交付。这些系统的共同特征是:高并发、高可靠、7×24小时不间断运行,对SLA有极致要求。这种能力本质上是对“高可靠服务”的系统性理解与交付能力,而非某种具体的技术栈。
当AI推理从实验室走向生产环境,成为企业核心业务流程的一部分时,它所需要的恰恰是这种运营商级的高可靠服务能力。模型可以运行在任意云上,但要让模型像核心业务系统一样持续稳定运行,需要的是对SLA的深刻理解、对运维体系的系统化构建、对大规模分布式系统的工程经验。
这正是软通动力(301236)持续深耕的方向——从核心业务系统到AI基础设施,能力是连续、一贯、逐步下沉的。这条路径一直在向前走。
Token工厂的商业闭环
Token工厂是由客户需求、操作系统和高可靠物理平台层共同构建而成。
客户需求。软通动力(301236)拥有大量正在使用AI服务的客户,AI相关业务收入已占公司总营收的相当比例。客户已经在用AI、依赖AI,需求真实存在。大模型厂商是我们走向市场的伙伴,我们和他们一起把Token服务交付给客户。需求拉动,是一切的基础。
操作系统。Token工厂的核心是面向Token时代的工厂级操作系统。它不是几个工程师搭建起来就能运转的系统,而是需要承载模型路由、全局缓存、智能调度、SLA保障、计量计费等一系列运营商级能力的复杂体系。具有极高的技术壁垒,在芯片层面,软通动力(301236)从算子适配、分布式通信到调度策略进行端到端调优,持续提升混合集群在真实推理负载下的效率。在模型层面,软通动力(301236)已适配主流大模型,建立了面向真实场景的服务质量评测标准——2026年6月,软通动力(301236)向全球开源“词元工厂性能基准”(含LoadGen 2.0),从标准入手,而不是从功能入手。在调度层面,平台可根据任务复杂度自动匹配最合适的模型,实现成本与体验的最优平衡。
高可靠物理平台。Token工厂需要7×24小时在线,需要覆盖全国的运维体系。软通动力(301236)拥有遍布全国主要数据中心的4000—5000人基础设施运维团队、200人左右的规划建设团队。这一规模的运维体系,是过去二十年持续深耕形成的系统能力。
北京壹号词元工厂一期规划每日Token产能达1.4万亿。北京壹号工厂发布后,为工厂提供配套服务的GPU维修公司也已在亦庄成立,计划9月开始正式对外服务。未来扩容需要更多电力保障,软通动力(301236)已经启动张家口和乌兰察布的布局——用绿电支撑Token生产,用规模效应持续降低单位Token成本。
正在发生的实践
2026年6月9日,北京壹号词元工厂在京点亮,同步向全球开源“词元工厂性能基准”(含LoadGen 2.0)。
6月25日,软通动力(301236)旗下的软通智算科技有限公司与某头部大模型厂商签署智算服务协议,为其提供基于北京壹号词元工厂的Token推理服务,涵盖大模型推理加速、高性能算力集群适配及行业AI应用落地等场景。根据协议,模型厂商将其大模型推理服务部署于北京壹号词元工厂,获得标准化、可SLA保障的Token推理服务,无需自建大规模推理集群。
这是北京壹号词元工厂正式投用后,首次向头部模型厂商开放标准化Token推理服务——也是Token工厂从产业构想走向生产环境的一次实战验证。
新SLA正在诞生
每一次基础设施变革,都会带来新的服务标准。
传统IT时代关注服务器在线率,云计算(885362)时代关注资源可用性,AI时代需要新的评价体系。未来的SLA将不再是设备级SLA,而是面向用户体验的服务级SLA——从首Token响应时间到生成速度,从长任务成功率到用户体验一致性,一套全新的评价体系正在形成。
共建Token工厂新时代
接下来,我们将围绕Token工厂架构、操作系统、多中心全网调度、全局缓存、计量计费、SLA体系、运维保障、评测体系等方向,持续推出系列技术文章,与行业伙伴共同探讨AI时代基础设施的发展路径。
未来十年,真正决定产业价值的,不只是模型本身,而是模型能力如何被稳定、高效、低成本地交付给全社会。
这正是Token工厂作为AI时代的生产方式所致力的方向。
