6 月 12 日,第八届北京智源大会在中关村国际创新中心开幕。现代数字安全体系奠基者 Whitfield Diffie、强化学习奠基人 Andrew Barto 与 200 余位顶尖专家学者、40 余位 AI 企业 CEO 及首席科学家、30 余位青年科学家齐聚,中国 AI 产业在世界模型与 Agent 领域最具代表性的创新力量首次集中同台,一同围绕世界模型、通用智能体、具身智能、AI 安全等前沿方向展开精彩演讲和前瞻性对话。
作为国内领先的国产全功能 GPU 企业,摩尔线程(688795)深度参与大会,多位技术专家在多个论坛及 Open Talk 环节发表演讲,系统呈现覆盖“云-边-端”的软硬协同全栈创新成果:
在大模型产业论坛,摩尔线程(688795)发表《面向大模型时代的智能计算:万卡集群大模型训练实践》主题演讲。面对训练算力需求激增、集群规模持续扩大与软硬件协同复杂度攀升等挑战,系统分享了基于国产万卡级智算集群夸娥(KUAE)的大规模分布式训练实践,并重点介绍了基于静态分析的集群性能仿真工具、异步通信引擎通算并行优化,以及利用强化学习进行 CUDA / MUSA 算子自动生成的全新路径,为降低大模型训练调优成本、提升算子开发效率提供了前沿的范式参考。
在智算前沿-AI 赋能系统论坛,摩尔线程(688795)带来《TiLISA& MTX:打造支撑多 DSL 的编译后端》技术分享。围绕 TiLISA 与 MTX 指令集构建的统一编译后端,深入阐释了 TiLISA 如何通过分块(Tile)计算抽象,突破传统 SIMT 编程模型以单线程为核心的局限,降低 Tensor Core 等新型硬件的编程复杂度;同时介绍了 MTX 作为面向国产全功能 GPU 的底层虚拟指令集的独特价值。通过兼容 Triton 等前端语言的实际实践,该方案不仅攻克了核函数跨架构移植的难题,更为打破算子开发效率与性能可移植性之间的“双重壁垒”提供了切实可行的解决思路。
在 Open Talk 环节,摩尔线程(688795)分享了 MTT AIBOOK 的全面升级。作为“为智能体而生”的 AI 算力本,AIBOOK 在 MTT AIOS 原生 Linux 系统下预装 OpenClaw 智能体,单机可以支持多达 12 个智能体高效并行运行,实现了智能体应用开发、调试与部署的完整闭环;凭借“工具直达”特性,AIBOOK 提供 90+ 工具调用能力,大幅降低配置成本;同时支持原生 Linux、虚拟 Windows 及容器化 Android 多系统,并预置了包括 LLM 在内的多种本地模型,实现了全套端侧感知能力,一台设备即可覆盖多场景 AI 开发与应用需求。
展台现场,摩尔线程(688795)携全栈产品矩阵精彩亮相,覆盖云、边、端核心场景。云端展示面向万亿参数大模型训练的夸娥万卡智算集群、AI 训推一体智算卡 MTT S5000 及 AI 大模型训推一体机 MTT SGX5000;端侧呈现 AI 算力本 MTT AIBOOK、家庭 AI 中枢 MTT AICUBE 及边缘 AI 计算模组 MTT E300;同时展出首个全栈具身智能仿真平台 MT Lambda 与国产生命科学智能计算解决方案,展现从底层算力到上层应用、从技术赋能到生态共建的完整布局。
作为国产算力的中坚力量,摩尔线程(688795)与智源研究院保持长期紧密合作,已取得多项标志性成果:
今年 1 月,双方基于 MTT S5000 千卡智算集群与 FlagOS-Robo 框架,成功完成具身大脑模型 RoboBrain 2.5 的完整端到端训练与对齐验证,训练 Loss 曲线与国际主流产品基线高度一致,相对误差小于 0.62%,线性扩展效率超 90%,验证了全功能 GPU 作为国产算力底座的可靠性。
今年 3 月,双方联合完成 FlagOS AI 训练“全要素”验证,基于 MTT S5000 实现 Qwen3-0.6B 端到端无中断训练,精度超越国际主流基线 1.65 个百分点,标志着国产全功能 GPU 在大模型训练中迈向“更优”。
今年 4 月,双方依托 MTT S5000 原生 FP8 引擎与 FlagOS 全栈软件体系,在 DeepSeek-V4 系列发布之际,即完成 Pro 和 Flash 双模型的 Day-0 适配,并发布开箱即用的国产化部署镜像,持续推动国产大模型生态建设。
从千卡集群训练具身大脑到万卡智算工程实践,从底层编译架构创新到软硬协同全栈落地,摩尔线程(688795)以全功能 GPU 为核心,依托从芯片、集群到软件栈的全栈自主能力,与智源研究院及众多产业伙伴一道,持续夯实国产算力底座,为前沿科研与产业创新提供坚实支撑,共同推动人工智能(885728)技术突破与高质量发展。
