最近,计算机视觉领域三大顶会之一ECCV 2026公布了论文录用名单,群核科技(HK0068)一口气入选了三篇论文
三篇论文覆盖了空间感知评测、强化学习数据生成、高保真仿真三个方向,也就是说,教机器人怎么看懂世界、怎么持续学习、怎么在虚拟环境里训练,群核科技(HK0068)全给安排上了!
01
论文一:SPEAR——联手英伟达、Adobe等大牛共同探索的仿真平台
训练机器人,最大的难题之一就是:真实世界太贵了。
让机器人在真实场景里反复摔跤、碰撞、试错,成本高、效率低,还可能出安全问题。所以研究者都想在虚拟世界里先练好,再到真实世界部署。
但现有的仿真器有个大问题:
要么画面太假,要么操作太麻烦,要么速度太慢。
群核科技(HK0068)联合英伟达(NVDA)、Adobe、Apple、Intel共同提出了 SPEAR,这篇论文聚集众多来自产业界的大牛,专门解这道题:
开放超过 14,000 个底层 Python 接口,研究者可以用代码精确控制场景里的一切
56帧/秒输出1080P高清画面,比同类仿真器快约15倍
同步输出深度图、材质、语义分割等多种传感器(885946)数据——机器人训练最需要的原材料
无缝接入群核科技(HK0068)开源的 InteriorAgent、InteriorGS 等数据集,资产天然带碰撞体、关节等物理属性,直接可用
简单说,SPEAR 做的事,是让机器人在虚拟世界里「看得真、练得快、控得准」,从而顺畅地迁移到真实世界。
02
论文二:Syn-GRPO——解决 AI 训练 “死记硬背”,训练时自动生成全新素材
有了仿真环境,下一个问题来了:训练数据从哪来?
传统的强化学习训练有个通病——“熵坍塌”和“多样性坍塌”。
翻译成人话就是:AI越训练越死板,同一张图翻来覆去只能给同一个回答,完全失去了探索精神。
群核科技(HK0068)联合浙江大学提出的Syn-GRPO解决的就是这个问题。它的思路很直接:边训练边造新题,而且造的题越来越难。
Syn-GRPO分两大模块:
模块一:多样化图像生成。
拿到一张“猫坐在沙发上”的图,把沙发背景换成森林、沙漠、太空站,但猫的位置和大小完全不变。这样新题的“正确答案”(猫在哪)还是准的,但“题干”变新了,AI没法靠死记硬背蒙混过关。
模块二:难度自适应系统。
AI越学越强,系统就自动生成更复杂的背景——从纯色背景进化到混乱街景,甚至出现现实中不存在的“超现实场景”。
关键是——数据是AI自己“造”出来的,不是人手工标注的。
这就是所谓的“自进化数据合成”:模型越强,出的题越难;题越难,模型越强,形成一个正循环。
03
论文三:WalkerBench——全球首个真实街景空间评测体系
如果说仿真和数据解决的是“怎么学”,那么评测解决的是——学得好不好。
群核科技(HK0068)联合浙江大学、智谱(HK2513)、字节跳动等推出的WalkerBench,是全球首个基于真实街景的交互式空间智能评测基准。
它覆盖全球六大洲161座城市的真实街景环境,测试AI在没有地图、没有GPS的情况下,仅依靠第一视角进行空间感知与导航能力。
WalkerBench测试结果揭示了一个关键问题:
人类完成率基线是70%左右,而当前最强AI模型完成率只有24.5%,而AI走的步数越多,性能下降越明显,这说明一个本质矛盾:
现有大模型的“线性文本记忆方式”,无法真正表达三维空间结构。
为此,我们还提出Spatial-IDE框架,为AI构建显式空间记忆结构,使模型对空间的理解方式从“文字顺序”升级为结构化理解。
更硬核的是,这套架构已经在宇树G1人形机器人(886069)上完成了零样本部署,在真实城市街道实现了公里级自主导航——虚拟考场学的,真机直接用。
SPEAR解决“在哪练”,Syn-GRPO解决“练什么”,WalkerBench解决“练得怎么样”。
三者咬合在一起,就是一套完整的 “数据—仿真—评测”全链路数据飞轮。
当然,这是一份阶段性答卷。
当AI开始走出屏幕,进入现实世界,新的基础设施也正在被重新定义。
群核科技(HK0068)正在做的,不只是训练模型,而是构建一个更底层的能力:让物理世界成为AI可以理解、可以学习、可以行动的“数据源”。
