三篇论文入选ECCV，物理AI的「训练场」搭起来了！

最近，计算机视觉领域三大顶会之一ECCV 2026公布了论文录用名单，群核科技（HK0068）一口气入选了三篇论文

三篇论文覆盖了空间感知评测、强化学习数据生成、高保真仿真三个方向，也就是说，教机器人怎么看懂世界、怎么持续学习、怎么在虚拟环境里训练，群核科技（HK0068）全给安排上了！

01 论文一：SPEAR——联手英伟达、Adobe等大牛共同探索的仿真平台

训练机器人，最大的难题之一就是：真实世界太贵了。

让机器人在真实场景里反复摔跤、碰撞、试错，成本高、效率低，还可能出安全问题。所以研究者都想在虚拟世界里先练好，再到真实世界部署。

但现有的仿真器有个大问题：

要么画面太假，要么操作太麻烦，要么速度太慢。

群核科技（HK0068）联合英伟达（NVDA）、Adobe、Apple、Intel共同提出了 SPEAR，这篇论文聚集众多来自产业界的大牛，专门解这道题：

开放超过 14,000 个底层 Python 接口，研究者可以用代码精确控制场景里的一切

56帧/秒输出1080P高清画面，比同类仿真器快约15倍

同步输出深度图、材质、语义分割等多种传感器（885946）数据——机器人训练最需要的原材料

无缝接入群核科技（HK0068）开源的 InteriorAgent、InteriorGS 等数据集，资产天然带碰撞体、关节等物理属性，直接可用

简单说，SPEAR 做的事，是让机器人在虚拟世界里「看得真、练得快、控得准」，从而顺畅地迁移到真实世界。

02

论文二：Syn-GRPO——解决 AI 训练 “死记硬背”，训练时自动生成全新素材

有了仿真环境，下一个问题来了：训练数据从哪来？

传统的强化学习训练有个通病——“熵坍塌”和“多样性坍塌”。

翻译成人话就是：AI越训练越死板，同一张图翻来覆去只能给同一个回答，完全失去了探索精神。

群核科技（HK0068）联合浙江大学提出的Syn-GRPO解决的就是这个问题。它的思路很直接：边训练边造新题，而且造的题越来越难。

Syn-GRPO分两大模块：

模块一：多样化图像生成。

拿到一张“猫坐在沙发上”的图，把沙发背景换成森林、沙漠、太空站，但猫的位置和大小完全不变。这样新题的“正确答案”（猫在哪）还是准的，但“题干”变新了，AI没法靠死记硬背蒙混过关。

模块二：难度自适应系统。

AI越学越强，系统就自动生成更复杂的背景——从纯色背景进化到混乱街景，甚至出现现实中不存在的“超现实场景”。

关键是——数据是AI自己“造”出来的，不是人手工标注的。

这就是所谓的“自进化数据合成”：模型越强，出的题越难；题越难，模型越强，形成一个正循环。

03 论文三：WalkerBench——全球首个真实街景空间评测体系

如果说仿真和数据解决的是“怎么学”，那么评测解决的是——学得好不好。

群核科技（HK0068）联合浙江大学、智谱（HK2513）、字节跳动等推出的WalkerBench，是全球首个基于真实街景的交互式空间智能评测基准。

它覆盖全球六大洲161座城市的真实街景环境，测试AI在没有地图、没有GPS的情况下，仅依靠第一视角进行空间感知与导航能力。

WalkerBench测试结果揭示了一个关键问题：

人类完成率基线是70%左右，而当前最强AI模型完成率只有24.5%，而AI走的步数越多，性能下降越明显，这说明一个本质矛盾：

现有大模型的“线性文本记忆方式”，无法真正表达三维空间结构。

为此，我们还提出Spatial-IDE框架，为AI构建显式空间记忆结构，使模型对空间的理解方式从“文字顺序”升级为结构化理解。

更硬核的是，这套架构已经在宇树G1人形机器人（886069）上完成了零样本部署，在真实城市街道实现了公里级自主导航——虚拟考场学的，真机直接用。

SPEAR解决“在哪练”，Syn-GRPO解决“练什么”，WalkerBench解决“练得怎么样”。

三者咬合在一起，就是一套完整的 “数据—仿真—评测”全链路数据飞轮。

当然，这是一份阶段性答卷。

当AI开始走出屏幕，进入现实世界，新的基础设施也正在被重新定义。

群核科技（HK0068）正在做的，不只是训练模型，而是构建一个更底层的能力：让物理世界成为AI可以理解、可以学习、可以行动的“数据源”。