“国产Sora”落地提速,Al改写视频产业链

2024-06-25 21:13:31 来源: 21世纪经济报道

  记者孔海丽、实习生芦子衿 北京报道

  被称为“国产Sora”的快手可灵视频大模型,又有新动作,其近日增加了图生视频和视频续写功能,最长可生成约3分钟视频,一举成为Sora的“3倍量”。

  今年6月初,快手自主研发的AI大模型“可灵”成为“首个面向用户开放的Sora级文生视频大模型”,据记者了解,至今仍无法使用Sora的国外网友们心痒难耐,甚至寻求中国手机号申请加入可灵测试。截至6月20日,可灵内测的排队申请人数超过14万人。

  这场AI视频大模型落地之争,赛道明显拥挤了起来。Sora之后,Stability AI 宣布Stable Video公测,紧接着谷歌、阿里巴巴、字节等公司也纷纷加入,更新或是公布自己的AI视频模型。

  一定程度上,Sora迟迟未向公众开放,给市面上的同类竞争选手留下了空间与时间。

  一方面,AI视频大模型初创公司正在加紧壮大队伍,比如Pika于近日新获得了5.8亿元融资,投后估值约为34亿元;另一方面,国内对标Sora的公司,在面向用户开放与商业落地上先行一步,让市场看到了AI视频大模型应用的具体场景与商业可能性。

  据记者了解,目前,AI大模型已经在影视、动画设计等行业实际应用,提升效率的同时,也在一定程度上替代了人工。

  实测可灵,3分钟生成5秒视频

  目前,可灵大模型已经可以通过快手旗下剪辑软件“快影”申请测试,记者实测发现,对于毫无视频制作经验的人群而言,可灵已经可以轻松化身“5秒短视频”制作工具,砍掉了超短视频的制作门槛。

  一年前,AI生成视频名场面——初代“威尔史密斯吃面”还处在粗制滥造阶段,如今,多家AI视频大模型都已经可以产出符合逻辑的吃面视频。

  在可灵生成的视频中,模拟出了主角用筷子夹起面条、甩汤、吃面的连贯动作。虽然细看还是会有一些小的瑕疵和形变,但可以看到,在吞咽时,中年男子面部的肌肉动态真实,碗中面条的运动轨迹合理。

  记者从快手方面了解到,可灵大模型采用了原生的文生视频技术路线,替代了“图像生成+时序模块”的组合,所以能够准确处理复杂运动。

  另外在时序信息建模上,快手大模型团队设计了一款全注意力机制(3D Attention)作为时空建模模块,该方法可以更准确地建模复杂时空运动,同时兼顾运算成本,提升了模型的建模能力。

  目前的AI视频中,生成双人互动依旧是比较弱势的一环。记者试着对双人情景进行测试,除去动作幅度较小之外,可灵将两位老人的手以及表情处理得很好,作为背景的街边路人也并未出现明显错误。

  但可灵相对Sora也有不足之处。在测试Sora最出圈的视频“东京女子漫步街头”时,可以看到,可灵生成的街景和人物面部都产生了一些相应的形变,女子的眼睛闭合不全。

  不过可以理解的是,快手是把视频制作的权限完全交到了用户手中,用户可以直观看到未经雕琢的第一手视频作品,而非官方经过精心训练、挑选过的demo,针对瑕疵视频,用户可以选择继续扩大提示词、多次尝试。

  国内其他主流视频企业虽然暂时还未出现类Sora的大型AI视频生成模型,但同样发布了一些短视频生成模型。目前,抖音集团也有专门的AIGC产品即梦(Dreamina),支持生成3秒视频,腾讯的混元大模型则能生成16秒视频。

  值得注意的是,与可灵发布时间相差不久,极佳科技联手清华大学自动化系所研发的AI视频模型“视界一粟(Yisu)”也公开发布了。据悉,视界一粟拥有模型原生的16秒时长,并可生成1分钟以上视频,主打性能与性价比。

  AI改变了作业方式

  从2023年到2024年,AI的飞速成长为视频产业链打开了一扇新的窗户。谈及AI视频大模型,亦是“喜忧参半”。

  在看到AI视频模型的颠覆性迭代后,演员、电影制片人兼制片厂老板泰勒·佩里 (Tyler Perry)为此搁置了耗资8亿美元的制片厂扩建计划。“当我看到它时,我立刻想到了每个行业中会受此影响的人,包括演员、配音和编辑。我认为这会触及到我们每个人的行业。”佩里曾表示。

  此前,佩里已经在两部电影中运用了AI技术。他谈到,通过人工智能的特效加持,仅仅在老化妆容的部分就省略了数个小时。

  未来, “创意”在视频行业的价值将大大提升。一位视频制作从业者告诉记者,AI的出现,极大降低了视频制作难度,对创作者个人审美和创意的考验随之提升。

  受到冲击的并非只有影视行业。

  一位在广告公司工作的宣传海报设计师向记者透露,一些比较简单的海报已经可以用AI生成,后期再进行人工修饰,这样的制作过程省略了许多以往制作海报的繁琐步骤。“人工智能的出现的确为我们的工作提供了一把趁手的工具。”她评价说。

  如果有创作者拥有好的想法而苦于经费不足或是技术问题,那么视频生成AI或许能帮助创作者把他们天马行空的想法变为现实。

  但事物本身具有两面性,AI同样如此。

  从事原画工作的一位场景概念设计师告诉记者,由于ChatGPT、Midjourney及国内的竞品等AI生成软件的出现,许多美术公司已经将“会用AI”纳入招聘需求,能够熟练运用AI是跨入公司的第一道门槛。

  “AI工具也加速了人员优化,毕竟它们产出快、成本低、可以反复调试。”前述人士表示。

  在欣赏过央视播出的AIGC诗词动画《千秋诗颂》后,一位动画专业的高校学生表示,AI特效能力让他反思起自己的专业能力。“AI所创作的动画目前已经能够达到比较完整的程度,并且还在持续发展。我不确定以后是否能够创作出比AI更加优秀的动画作品。”他坦言。

  “AI是不可抵挡的时代趋势,我们应该适当地改变教学内容。”一位高校教师表示。

  关于AI视频大模型的应用将为视频产业链带来哪些影响,快手视觉生成与互动中心负责人万鹏飞认为,当AI视频生成效果接近图形渲染时,将为特效、游戏、动画行业带来变革;当效果接近视频拍摄时,将对泛视频行业带来新挑战和新机遇。

  “此外视频创作者和消费者的界限会逐渐模糊,未来如果有越来越多的视频消费者变成创作者,对于整个视频内容生态的繁荣是非常有帮助的。”万鹏飞说,好技术与好产品之间还存在着巨大的鸿沟,仍有非常多的工作待完成,才能够真正把一个好技术推向市场。

  无论如何,AI已经真实改变了视频产业链,接下来,如何用好这把利刃,是行业需要好好思考的问题。

关注同花顺财经(ths518),获取更多机会

0

+1
  • 领益智造
  • 百邦科技
  • 时空科技
  • 科创信息
  • 线上线下
  • 金道科技
  • 温州宏丰
  • 税友股份
  • 代码|股票名称 最新 涨跌幅