“国产Sora”落地提速，Al改写视频产业链

2024-06-25 21:13:31 来源： 21世纪经济报道

　　记者孔海丽、实习生芦子衿北京报道

　　被称为“国产Sora”的快手可灵视频大模型，又有新动作，其近日增加了图生视频和视频续写功能，最长可生成约3分钟视频，一举成为Sora的“3倍量”。

　　今年6月初，快手自主研发的AI大模型“可灵”成为“首个面向用户开放的Sora级文生视频大模型”，据记者了解，至今仍无法使用Sora的国外网友们心痒难耐，甚至寻求中国手机号申请加入可灵测试。截至6月20日，可灵内测的排队申请人数超过14万人。

　　这场AI视频大模型落地之争，赛道明显拥挤了起来。Sora之后，Stability AI 宣布Stable Video公测，紧接着谷歌、阿里巴巴、字节等公司也纷纷加入，更新或是公布自己的AI视频模型。

　　一定程度上，Sora迟迟未向公众开放，给市面上的同类竞争选手留下了空间与时间。

　　一方面，AI视频大模型初创公司正在加紧壮大队伍，比如Pika于近日新获得了5.8亿元融资，投后估值约为34亿元；另一方面，国内对标Sora的公司，在面向用户开放与商业落地上先行一步，让市场看到了AI视频大模型应用的具体场景与商业可能性。

　　据记者了解，目前，AI大模型已经在影视、动画设计等行业实际应用，提升效率的同时，也在一定程度上替代了人工。

　　实测可灵，3分钟生成5秒视频

　　目前，可灵大模型已经可以通过快手旗下剪辑软件“快影”申请测试，记者实测发现，对于毫无视频制作经验的人群而言，可灵已经可以轻松化身“5秒短视频”制作工具，砍掉了超短视频的制作门槛。

　　一年前，AI生成视频名场面——初代“威尔史密斯吃面”还处在粗制滥造阶段，如今，多家AI视频大模型都已经可以产出符合逻辑的吃面视频。

　　在可灵生成的视频中，模拟出了主角用筷子夹起面条、甩汤、吃面的连贯动作。虽然细看还是会有一些小的瑕疵和形变，但可以看到，在吞咽时，中年男子面部的肌肉动态真实，碗中面条的运动轨迹合理。

　　记者从快手方面了解到，可灵大模型采用了原生的文生视频技术路线，替代了“图像生成+时序模块”的组合，所以能够准确处理复杂运动。

　　另外在时序信息建模上，快手大模型团队设计了一款全注意力机制（3D Attention）作为时空建模模块，该方法可以更准确地建模复杂时空运动，同时兼顾运算成本，提升了模型的建模能力。

　　目前的AI视频中，生成双人互动依旧是比较弱势的一环。记者试着对双人情景进行测试，除去动作幅度较小之外，可灵将两位老人的手以及表情处理得很好，作为背景的街边路人也并未出现明显错误。

　　但可灵相对Sora也有不足之处。在测试Sora最出圈的视频“东京女子漫步街头”时，可以看到，可灵生成的街景和人物面部都产生了一些相应的形变，女子的眼睛闭合不全。

　　不过可以理解的是，快手是把视频制作的权限完全交到了用户手中，用户可以直观看到未经雕琢的第一手视频作品，而非官方经过精心训练、挑选过的demo，针对瑕疵视频，用户可以选择继续扩大提示词、多次尝试。

　　国内其他主流视频企业虽然暂时还未出现类Sora的大型AI视频生成模型，但同样发布了一些短视频生成模型。目前，抖音集团也有专门的AIGC产品即梦（Dreamina），支持生成3秒视频，腾讯的混元大模型则能生成16秒视频。

　　值得注意的是，与可灵发布时间相差不久，极佳科技联手清华大学自动化系所研发的AI视频模型“视界一粟（Yisu）”也公开发布了。据悉，视界一粟拥有模型原生的16秒时长，并可生成1分钟以上视频，主打性能与性价比。

　　AI改变了作业方式

　　从2023年到2024年，AI的飞速成长为视频产业链打开了一扇新的窗户。谈及AI视频大模型，亦是“喜忧参半”。

　　在看到AI视频模型的颠覆性迭代后，演员、电影制片人兼制片厂老板泰勒·佩里 (Tyler Perry)为此搁置了耗资8亿美元的制片厂扩建计划。“当我看到它时，我立刻想到了每个行业中会受此影响的人，包括演员、配音和编辑。我认为这会触及到我们每个人的行业。”佩里曾表示。

　　此前，佩里已经在两部电影中运用了AI技术。他谈到，通过人工智能的特效加持，仅仅在老化妆容的部分就省略了数个小时。

　　未来， “创意”在视频行业的价值将大大提升。一位视频制作从业者告诉记者，AI的出现，极大降低了视频制作难度，对创作者个人审美和创意的考验随之提升。

　　受到冲击的并非只有影视行业。

　　一位在广告公司工作的宣传海报设计师向记者透露，一些比较简单的海报已经可以用AI生成，后期再进行人工修饰，这样的制作过程省略了许多以往制作海报的繁琐步骤。“人工智能的出现的确为我们的工作提供了一把趁手的工具。”她评价说。

　　如果有创作者拥有好的想法而苦于经费不足或是技术问题，那么视频生成AI或许能帮助创作者把他们天马行空的想法变为现实。

　　但事物本身具有两面性，AI同样如此。

　　从事原画工作的一位场景概念设计师告诉记者，由于ChatGPT、Midjourney及国内的竞品等AI生成软件的出现，许多美术公司已经将“会用AI”纳入招聘需求，能够熟练运用AI是跨入公司的第一道门槛。

　　“AI工具也加速了人员优化，毕竟它们产出快、成本低、可以反复调试。”前述人士表示。

　　在欣赏过央视播出的AIGC诗词动画《千秋诗颂》后，一位动画专业的高校学生表示，AI特效能力让他反思起自己的专业能力。“AI所创作的动画目前已经能够达到比较完整的程度，并且还在持续发展。我不确定以后是否能够创作出比AI更加优秀的动画作品。”他坦言。

　　“AI是不可抵挡的时代趋势，我们应该适当地改变教学内容。”一位高校教师表示。

　　关于AI视频大模型的应用将为视频产业链带来哪些影响，快手视觉生成与互动中心负责人万鹏飞认为，当AI视频生成效果接近图形渲染时，将为特效、游戏、动画行业带来变革；当效果接近视频拍摄时，将对泛视频行业带来新挑战和新机遇。

　　“此外视频创作者和消费者的界限会逐渐模糊，未来如果有越来越多的视频消费者变成创作者，对于整个视频内容生态的繁荣是非常有帮助的。”万鹏飞说，好技术与好产品之间还存在着巨大的鸿沟，仍有非常多的工作待完成，才能够真正把一个好技术推向市场。

　　无论如何，AI已经真实改变了视频产业链，接下来，如何用好这把利刃，是行业需要好好思考的问题。

0人

代码\|股票名称	最新	涨跌幅

网站地图