同花顺 Logo
AIME助手
问财助手
中国移动发布 MoMA 平台:单位 Token 成本压降 30%,接入超 300 款 AI 模型
2026-05-08 12:50:12
来源:IT之家
分享
AIME

问财摘要

1、中国移动发布了移动模型服务平台MoMA,接入超过300款业界主流AI模型,提供统一API网关,覆盖文本生成、语音处理、多模态理解等多项能力,满足不同场景应用需求。 2、MoMA平台基于国产算力部署自研推理引擎打造,结合智能路由对长尾模型资源调度,实现单位Token成本压降约30%、降低资源占用率50%以上。 3、同时,该平台还首创智能路由引擎技术,可根据用户需求灵活切换“成本优先”“效果优先”“均衡优先”等三种策略,为用户动态匹配最适合的模型。 4、此外,MoMA还带有“机密模型”服务,将模型部署在机密容器中,基于硬件隔离技术保障计算过程的数据安全,为政务、金融等数据安全要求较高的场景提供可靠支撑。
免责声明 内容由AI生成
文章提及标的
中国移动--
数据安全--

IT之家 5 月 8 日消息,中国移动(HK0941)今天发布移动模型服务平台 MoMA,接入超 300 款业界主流 AI 模型,首创 Token(词元)集约化运营模式,基于国产算力部署自研推理引擎打造。

IT之家从官方新闻稿了解到,MoMA 可提供统一 API 网关,目前已接入中国移动(HK0941)自研基座大模型“九天”,以及 DeepSeek、通义千问、豆包、Kimi、GLM 等业界优质模型,覆盖文本生成、语音处理、多模态理解等多项能力,满足政务、金融、工业、医疗等场景应用需求。

MoMA 平台基于国产算力部署自研推理引擎打造,结合智能路由对长尾模型资源调度,实现单位 Token 成本压降约 30%、降低资源占用率 50% 以上。还能通过智能缓存、上下文复用、Token 压缩等技术进一步降低使用成本。

同时,该平台还首创智能路由引擎技术,可根据用户需求灵活切换“成本优先”“效果优先”“均衡优先”等三种策略,为用户动态匹配最适合的模型。当模型出现超时、限流或故障时,平台可自动实现秒级切换,确保业务连续不中断。

此外,MoMA 还带有“机密模型”服务,将模型部署在机密容器中,基于硬件隔离技术保障计算过程的数据安全(885942),覆盖从芯片到应用的全链路机密计算,为政务、金融等数据安全(885942)要求较高的场景提供可靠支撑。

免责声明:风险提示:本文内容仅供参考,不代表同花顺观点。同花顺各类信息服务基于人工智能算法,如有出入请以证监会指定上市公司信息披露平台为准。如有投资者据此操作,风险自担,同花顺对此不承担任何责任。
homeBack返回首页
不良信息举报与个人信息保护咨询专线:10100571违法和不良信息涉企侵权举报涉算法推荐举报专区涉青少年不良信息举报专区

浙江同花顺互联信息技术有限公司版权所有

网站备案号:浙ICP备18032105号-4
证券投资咨询服务提供:浙江同花顺云软件有限公司 (中国证监会核发证书编号:ZX0050)
AIME
举报举报
反馈反馈