3月19日,天工AI大模型SkyReels V4登上Artificial Analysis榜单Text to Video (With Audio) 赛道全球第一,显著超越Kling 3.0、Google Veo 3.1、Vidu Q3、OpenAI Sora 2等全球主流模型,成为全球AI视频生成能力最强的大模型,标志中国AI视频生成技术实现世界级引领。
榜单地址:https://artificialanalysis.ai/video/leaderboard/text-to-video?audio-output=true
同时,SkyReels V4正式上线API入口,面向全场景开放API能力。
SkyReels V4 API核心能力完整覆盖本模型的所有核心功能,从基础的文生视频(886068)、图生视频,到多模态参考生成、视频编辑与修复、音画联合生成,全能力开放、支持灵活的参数配置,满足不同场景的定制化需求。
无论是内容平台、电商平台、教育机构、品牌方,还是开发者团队、创作工作室等,无需从零开始搭建大模型,不用再投入巨额的研发成本,只需要通过SkyReels的API,即可直接调用这套全球顶尖的音视频联合生成能力,为自己的产品、业务、场景赋能。
我们希望将SkyReels V4的视频生成核心能力嵌入到每一个有需求的场景里,赋能全行业的合作伙伴。
使用入口
SkyReels V4 官网地址:https://www.skyreels.ai/
SkyReels V4 API地址:https://www.skyreels.ai/api-platform SkyReels V4在双流架构解决音画同步核心问题的基础上,带来两大核心变革:一方面通过全模态强化学习(RL)为AI注入逻辑推理能力;另一方面,新增多帧参考、网格图参考等高阶任务,将视频生成的一致性与可控性推至行业新高度。
1
核心突破一:全模态强化学习体系全面升级,从语义Reward到阶梯式课程学习
针对传统扩散模型重局部像素、轻整体语义逻辑、物理常识与叙事逻辑的行业痛点,我们打造了一套从评判标准到成长路径的完整强化学习体系。
一方面搭建全模态语义Reward模型,覆盖文生视频(886068)(T2V)、图生视频(I2V)、视频编辑、音视频对齐全场景,为生成提供全局精准的实时反馈,全方位优化生成效果;另一方面采用阶梯式课程强化学习路径,从分辨率与时长、任务复杂度、数据难度三个维度,让模型由简入繁掌握复杂能力,最终实现1080p 15s商用长序列生成,以及多任务大一统的能力框架。
该体系不仅实现了模型全任务能力的全面提升,更带来了极强的跨任务泛化性,模型习得的视频生成底层通用规律,可在不同任务间自由迁移。
2
核心突破二:新增两大高阶参考任务,大幅拓展应用边界
本次升级新增关键帧参考能力 (Keyframe Reference)与网格图参考能力 (Grid Image Reference),全面提升视频生成的稳定性与灵活性。
其中,关键帧参考能力可基于用户给定的多节点关键帧,精准推演逻辑严密、动作连贯的中间画面,实现极强的时空补完能力;专为短剧生成打造的网格图参考能力,支持用户上传至多9张剧情关键帧,模型可稳定提取并保留角色特征与场景风格,生成逻辑完整、角色与场景全程连贯的叙事视频,解决了短剧生成中角色走形、场景跳跃的行业痛点。
3
做坚实的技术赋能者,SkyReels与行业共同迎接AI视听新时代
过去一年多,SkyReels团队致力于将 “生成专业、好用、有感染力的视听内容”,变成可复现、可控制、可迭代的系统能力。
昆仑万维(300418)已经陆续发布并开源多个SkyReels模型,包括SkyReels V1、SkyReels V2、SkyReels V3、SkyReels V4,以及SkyReels A1、SkyReels A2和SkyReels A3。
其中,2025年上半年,SkyReels A1模型发布,将人像动画、表情驱动功能做到极致,打破AI人像 “僵硬、无灵魂” 的行业痛点;2025年年中,SkyReels V2开源,攻克无限时长影视生成核心难题,迈出从 “生成片段” 到 “生成故事” 的关键一步;2026年初,SkyReels V3升级迭代,多模态理解、画面一致性、动态流畅度、生成质量全面跃升,完成从 “能生成” 到 “生成得好” 的跨越。
今天登顶Artificial Analysis榜单Text to Video (With Audio) 赛道全球第一,和用户见面的SkyReels V4模型,不是偶然的技术爆发,而是团队沿着高质量视频生成这条路,持续深耕、反复打磨,自然生长出来的结果。它不是单点能力的升级,而是从底层架构到上层能力,从生成质量到创作自由度,全维度的革新与突破。
未来,SkyReels希望在AI视听这个全新的赛道上,做最坚实的技术赋能者,用最顶尖的技术打破创作的门槛,与全行业伙伴一起,迎接这个属于 AI 视听的全新时代。
