上证报中国证券网讯(记者 杨翔菲)6月17日,阿里发布可实时构建和交互的开放式世界模型产品HappyOyster 1.0(快乐生蚝1.0),该产品深度学习物理世界状态转移规律,能主动推演从动作到反馈的因果链,并保持人物和环境的长程一致性。
HappyOyster 1.0具备世界探索(Adventure)和实时导演(Directing)两大核心能力,并升级了交互功能,新增攻击、跳跃、剧情回溯、剧情分支等操控能力,用户仅需一句话或一张图,就能生成可互动、可探索、可实时改变的AI数字世界。HappyOyster 1.0可广泛应用于交互式游戏(881275)、虚拟陪伴、互动短剧、文旅体验、直播等行业,目前官网已开放用户注册体验。
区别于文生视频模型从输入文字到生成视频的单向操作,HappyOyster 1.0能让用户完成丰富的实时互动,并支持用户在任意节点介入,改变数字世界的走向。上述差异源自模型学习目标的不同,文生视频模型的学习目标是文本到视频的单向映射,而世界模型的学习目标是从“当前状态/动作”到“下一状态/动作”的转移规律。相较于大语言模型日趋成熟的架构与范式,世界模型仍属于新兴赛道,而HappyOyster 1.0已在探索该赛道的前沿。
相较上一版,HappyOyster 1.0在交互能力上做了优化升级。目前,世界探索模式支持长达1分钟的连续实时位移与镜头控制,实时导演模式支持生成3分钟以上的480p或720p实时画面,且两个模式的生成内容均能一键分享。
世界模型的发展仍处于早期阶段,业界缺乏可量化的测评标准。目前,HappyOyster团队联合南京大学,正在着手打造首个覆盖过程交互、跨模态对齐、长程一致与物理仿真验证的行业基准,旨在填补世界模型测评标准的空白。据悉,HappyOyster 1.0近期还会全面开放API接口,携手各行各业共建世界模型的新生态。
