面壁智能联合清华开源中国首个基于昇腾训练的1.58-bit端侧大模型

2026-05-25 11:59:22
来源:AI观察
分享
文章提及标的
华为昇腾--

据面壁智能消息,面壁智能联合清华大学、OpenBMB开源社区,于5月25日正式发布并开源了其低比特大模型训练最新成果——BitCPM-CANN。这是中国首个完全基于国产算力平台华为昇腾(886058)实现端到端训练并开源的三值(1.58-bit)大模型,包含0.5B、1B、3B、8B四个尺寸。相比传统BF16精度,该模型在推理阶段可释放约6倍显存红利,同时将模型能力保留率维持在90%至97.2%。

6倍显存红利,打破端侧AI天花板

BitCPM-CANN采用量化感知训练(QAT)技术路线,从训练初始阶段就让模型主动学习用1.58-bit的三值权重(-1,0,+1)来承载知识,而非传统的事后压缩。评测显示,其三个较大尺寸模型的能力保留率达95.7%—97.2%,0.5B模型也超过90%。这一技术突破对产业影响深远:对手机等终端而言,6倍显存优化意味着未来有望在手机上运行60B大模型;对芯片生态,它填补了端侧芯片在低比特模型“供给侧”的空白;对AI应用,则提供了显著的降本方案。

基于昇腾,攻克国产算力极低比特训练难题

BitCPM-CANN完全基于华为昇腾(886058)平台原生完成训练,从底层量化算子、QAT算法到完整训练框架。这是昇腾平台上首个公开的、端到端完成1.58-bit训练并进行全精度对照评测的成果,且规模推进至8B级别。此举意味着国产NPU阵营首次拥有了自己的1.58-bit低比特训练栈,打破了“国产芯片只能跑推理”的刻板印象。

端侧大模型:底层功夫决定上层高度

BitCPM-CANN是面壁智能在端侧大模型领域多年技术积累的体现。公司自2022年自研训练框架BMTrain以来,持续构建体系化的高效端侧方案。早在2024年下半年,面壁智能便选定了≤2bit的QAT路线,此次成果是将已在GPU上验证的技术路线整体迁移至国产NPU训练底座的成功实践。

坚持开源,系统验证

面壁智能联合OpenBMB开源社区,将BitCPM-CANN全系列模型全面开源,旨在为开发者提供零门槛体验国产算力低比特性能的机会,并推动二次创新。目前,模型权重已在HuggingFace和ModelScope平台开放下载。

原文:面壁智能联合清华正式开源中国首个基于昇腾训练的 1.58-bit 端侧大模型 BitCPM-CANN(来源:面壁智能)

免责声明:风险提示:本文内容仅供参考,不代表同花顺观点。同花顺各类信息服务基于人工智能算法,如有出入请以证监会指定上市公司信息披露平台为准。如有投资者据此操作,风险自担,同花顺对此不承担任何责任。
homeBack返回首页
不良信息举报与个人信息保护咨询专线:10100571违法和不良信息涉企侵权举报涉算法推荐举报专区涉青少年不良信息举报专区

浙江同花顺互联信息技术有限公司版权所有

网站备案号:浙ICP备18032105号-4
证券投资咨询服务提供:浙江同花顺云软件有限公司 (中国证监会核发证书编号:ZX0050)
AIME
举报举报
反馈反馈