视频生成模型 HappyHorse 1.1 正式发布,现已登陆 HappyHorse 官网、千问云及阿里云百炼平台。 相较1.0版本,HappyHorse 1.1围绕动态表现力、主体一致性、指令遵循、视觉呈现质量、音频表达能力等维度进行了系统升级,进一步提升模型在专业内容生产场景中的创作质量、可控性与应用效率。
动态表现力提升,动作更连贯
针对1.0版本部分画面动作迟缓、节奏不足的问题,1.1版本优化了运动建模与时序一致性能力,提升了复杂动作场景下的连贯性和力量感。
支持9张参考图输入,主体一致性增强
1.1版本的多图参考生视频(R2V)能力支持9张角色参考图同时输入,可保持商品细节、品牌元素稳定,多分镜与N宫格参考理解增强。在多角色短剧、直播带货、多人物广告等场景中,角色一致性更加可控。
指令遵循能力增强,适配简洁与复杂提示词
1.1版本强化了长上下文语义理解与镜头编排稳定性。对于打斗等高强度动态场景,简洁提示词即可理解;对于复杂叙事输入,可完成多场景、多角色的连贯演绎。
视觉质感优化,缓解“油光感”与“过度锐化”
此前用户反馈集中的"油光感""过度锐化"等问题在1.1版本中得到缓解,模型在保留痘印、法令纹、毛孔等细节真实感的基础上,降低了涂抹感,可满足短剧、广告等对画面质感要求较高的场景。同时增强了对正反打、跟拍等专业镜头语言的理解。
音频能力优化,音画同步精度提升
台词表达方面,语速、停顿、语气可根据场景与情绪变化动态调整。用户可在提示词中描述背景音乐、环境音效等声音元素。音画同步能力进一步增强,降低了声音与画面动作之间的错位。
