刷新旗舰模型全球推理速度!小米上线MiMo-V2.5-Pro-UltraSpeed模式

2026-06-09 11:08:54
来源:财经网
分享
AIME

问财摘要

1、小米MiMo技术团队上线了Xiaomi MiMo-V2.5-Pro-UltraSpeed模式,这是全球首个在通用GPU上推理速度突破1000tokens/s的万亿参数模型,刷新旗舰模型全球推理最快速度。 2、该模式通过对模型推理系统的全链路工程能力优化,在不降低模型能力前提下,首次把推理速度提升至1000tokens/s,且无需定制芯片、只使用通用GPU即可达成。 3、自4月底以来,小米AI在模型能力、推理成本和推理效率三个维度接连取得突破。
免责声明 内容由AI生成

6月8日晚,小米MiMo技术团队正式上线Xiaomi MiMo-V2.5-Pro-UltraSpeed模式,这是全球首个在通用GPU上推理速度突破1000tokens/s的万亿参数模型,刷新旗舰模型全球推理最快速度。

MiMo-V2.5-Pro-UltraSpeed通过对模型推理系统的全链路工程能力优化,在不降低模型能力前提下,首次把推理速度提升至1000tokens/s,且无需定制芯片、只使用通用GPU即可达成。这一突破打破了“快、强、通用GPU无法兼得”的行业不可能三角,小米MiMo大模型推理工程实力跻身全球第一梯队。

即日起至6月23日,MiMo-V2-Pro-UltraSpeed模式将采取申请制限时开放,通过申请的用户可接入API进行体验。

值得一提的是,自4月底以来,小米AI在模型能力、推理成本和推理效率三个维度接连取得突破:4月23日,MiMo-V2.5-Pro在全球权威大模型测评平台Artificial Analysis上,获得综合智能指数与Agent指数全球开源模型并列第一;5月27日,Xiaomi MiMo-V2.5系列模型API因技术优化宣布最高降价99%,并同步调整Token Plan计费体系。6月8日,MiMo-V2.5-Pro-UltraSpeed以1000tokens/s创下万亿参数旗舰模型推理速度新纪录。

免责声明:风险提示:本文内容仅供参考,不代表同花顺观点。同花顺各类信息服务基于人工智能算法,如有出入请以证监会指定上市公司信息披露平台为准。如有投资者据此操作,风险自担,同花顺对此不承担任何责任。
homeBack返回首页
不良信息举报与个人信息保护咨询专线:10100571违法和不良信息涉企侵权举报涉算法推荐举报专区涉青少年不良信息举报专区

浙江同花顺互联信息技术有限公司版权所有

网站备案号:浙ICP备18032105号
证券投资咨询服务提供:浙江同花顺云软件有限公司 (中国证监会核发证书编号:ZX0050)
AIME
举报举报
反馈反馈