软通动力与某头部大模型厂商签署智算服务协议

2026-06-25 17:03:27
分享
AIME

问财摘要

1、近日,软通动力与某头部大模型厂商签署智算服务协议,双方将在大模型推理加速、高性能算力集群优化、服务质量保障及行业AI应用落地等方面开展合作,推动智能体时代从模型到Token服务的产业闭环。
免责声明 内容由AI生成
文章提及标的
软通动力--

近日,软通动力(301236)与某头部大模型厂商在北京签署智算服务协议。根据协议,软通动力(301236)将为该模型厂商提供基于北京壹号词元工厂的Token推理服务,涵盖大模型推理加速、高性能算力集群适配及行业AI应用落地等场景,共同推动智能体时代从模型到Token服务的产业闭环。

该模型厂商作为国内领先的大模型企业,在推理性能、长上下文处理及多轮交互等维度表现突出,在行业权威评测中位居前列。

软通动力:Token工厂基础设施的先行者

2026年6月9日,软通动力(301236)“词元工厂计划”的首个标杆示范项目——“北京壹号词元工厂”在京点亮,并同步向全球开源“词元工厂性能基准”(含评测框架LoadGen 2.0)。这是行业首次针对智能体长时运行特征建立统一的性能度量标准。项目一期每日Token产能达1.4万亿。北京壹号词元工厂聚焦智能体服务工作负载,通过极限工程化手段压榨硬件性能,集成前沿算力调度与KV Cache极致复用算法,以确定性的服务质量与极致的性价比,为智算时代提供确定性、高弹性的供应保障。

服务内容

根据协议,双方将在大模型推理加速、高性能算力集群优化、服务质量保障及行业AI应用落地等方面开展合作。

在模型推理加速方面,模型厂商将其大模型推理服务部署于北京壹号词元工厂,依托软通动力(301236)全栈观测体系和智能调度能力,获得标准化、可SLA保障的Token推理服务。软通动力(301236)提供弹性可扩展的Token产能,支撑其面向企业及开发者的规模化推理需求。

在高性能算力集群优化方面,双方将协同优化高性能算力集群上的推理性能,从算子适配、分布式通信到调度策略进行端到端调优,提升芯片在真实推理负载下的效率。

在服务质量保障方面,软通动力(301236)将根据模型厂商的业务需求,提供差异化SLA保障,通过实时观测与持续优化确保服务质量满足大规模商业化部署要求。

在行业AI应用落地方面,双方将围绕重点行业客户的AI应用需求,联合输出行业解决方案。

对双方的价值

对模型厂商而言,大规模商业化部署需要稳定、高效、可SLA保障的Token服务作为底座。通过本次合作,模型厂商可直接调用北京壹号词元工厂的标准化Token服务,无需自建大规模推理集群,聚焦模型研发与应用创新。

对北京壹号词元工厂而言,头部模型厂商的真实业务负载——包括长链路推理、多轮交互、高并发调用等复杂场景——是对Token工厂调度能力、缓存管理能力和服务质量保障能力的实战检验。此次合作将使北京壹号词元工厂在真实的高价值场景中验证并完善其Token服务体系。

双方将在大模型推理加速、高性能算力集群优化、行业AI应用落地等方面展开深度协同,推动智能体时代从模型到Token服务的产业闭环,助力千行百业以更低成本、更高效率获取和应用AI能力。

免责声明:风险提示:本文内容仅供参考,不代表同花顺观点。同花顺各类信息服务基于人工智能算法,如有出入请以证监会指定上市公司信息披露平台为准。如有投资者据此操作,风险自担,同花顺对此不承担任何责任。
homeBack返回首页
不良信息举报与个人信息保护咨询专线:10100571违法和不良信息涉企侵权举报涉算法推荐举报专区涉青少年不良信息举报专区

浙江同花顺互联信息技术有限公司版权所有

网站备案号:浙ICP备18032105号
证券投资咨询服务提供:浙江同花顺云软件有限公司 (中国证监会核发证书编号:ZX0050)
AIME