同花顺 Logo
AIME助手
问财助手
HappyHorse 1.0开启灰测,已登陆阿里云百炼!
2026-04-27 19:42:39
来源:阿里云
分享
AIME

问财摘要

1、阿里巴巴的视频生成模型HappyHorse 1.0已经上线灰度测试。该模型采用多模态架构,支持音视频联合生成,并且能够提供从生成到编辑的一站式支持。
免责声明 内容由AI生成
文章提及标的
阿里巴巴--
布鲁克--
空调--
Robot--
Inspired--
TheOne--

刚刚,阿里巴巴(BABA)视频生成模型HappyHorse 1.0正式开启灰测。

该模型采用原生多模态架构,实现了音视频联合生成。它不仅支持文生视频(886068)、图生视频等多种创作方式,还具备灵活的后期编辑能力。依托1080P超分输出与15秒多镜头叙事技术,HappyHorse 1.0在画面质感、人物真实感及内容可控性上表现出色。

无论是广告电商、短剧创作还是社媒创意,HappyHorse 1.0都能提供从生成到编辑的一站式支持,让创意表达更加高效、精准。

HappyHorse视频生成定价720P 0.9元/秒、1080P 1.6元/秒。HappyHorse官网会员包月叠加限时折扣后低至720P 0.44元/秒、1080P 0.78元/秒;API服务可通过阿里(BABA)云百炼直接调用。

# 核心亮点

作为视频生成领域的新人,HappyHorse 1.0主要在画面质感与光影效果、运镜与转场流畅度、面部/人物真实感等方面有着优秀表现。

// 电影级画面质感与光影表现

无论是人物肤质、发丝细节,还是金属反光、烟雾水雾等自然元素,HappyHorse均能呈现高度真实的视觉质感。画面精细度与成片质感多次获得用户高评价。

T2V提示词:A cinematic script scene set in a sun-drenched Parisian café, golden afternoon light spilling through arched windows. A sharp-dressed man in a tailored navy suit sits across from an elegant woman in a flowing crimson dress, half-empty coffee cups between them. The air is thick with unspoken tension. He leans forward, voice low and steady: "You knew from the beginning, didn't you? That none of this was real." She holds his gaze without flinching, a ghost of a smile on her lips, slowly stirring her coffee: "Everything was real. That's exactly what makes it so dangerous." Cinematic wide-angle composition, warm golden hour lighting, shallow depth of field, film grain texture, muted vintage color palette with deep crimson accents, highly detailed wardrobe and facial expressions, noir romantic aesthetic, emotionally charged atmosphere, European street photography style, dramatic storytelling, 35mm film look.

// 流畅稳定的运镜与转场能力

模型在镜头运动的连贯性和转场的自然度上表现优秀,支持拉近、拉远、景深变换等多种运镜方式,过渡丝滑,色调与环境融合连贯,能较好地遵循prompt中的镜头语言指令。

T2V提示词:纽约城市景观·超现实主义FPV一镜到底镜头脚本。镜头从紧贴地面的极低角度猛然弹射而出,沿清晨无人的曼哈顿街头疾速贴地飞行。两侧褐石建筑、红砖楼宇化作流动色块,柏油路面的裂缝折射晨光,偶尔掠过的铸铁护栏、街头消防栓留下模糊残影。摄像机保持离地30厘米,每秒数米冲刺,轻微横向摇摆模拟手持呼吸感,悬铃木枝叶间隙的晨光形成连续光斑扫掠,落在复古的金属门牌号上。接近街角Bagel店时,镜头减速滑行、缓缓抬升,以弧线绕过第一张金属折叠桌,不锈钢面包篮的纹路掠过画面边缘。推进至Bagel店摊位深处,运动转为慢动作凝滞,以毫米级速度爬行,围绕悬浮的水流形成的文字 “HappyHorse 1.0”、冰美式咖啡、《纽约邮报》、Bagel面包等物品。镜头推至文字前方 15 厘米处静止凝视,液态文字微微涌动。瞬间,文字爆裂成无数水珠,摄像机被气浪猛推,急速后拉并向下俯冲,轨迹呈剧烈J形转折。镜头以自由落体砸向地面,触地前一帧再次突变,贴地超低空滑行,视角侧倾近 90度,右侧红砖建筑立面垂直耸立,街头黄色出租车的轮胎在视野边缘飞速后退。滑行两秒后,镜头向上弹射,沿曼哈顿摩天大楼(帝国大厦旁)外墙垂直爬升,仰角从水平转为垂直向上,玻璃幕墙反射的晨光形成连续光带,映出远处自由女神像的剪影。爬升至屋顶高度,外翻越过天台围栏,空中完成180 度轴向翻转,从仰望天空转为俯视深渊,沿世贸中心双子塔遗址周边高楼间的狭窄天井垂直下坠。下坠初始速度适中,镜头朝下稳定俯拍,天井四壁如方形画框向中心收缩,下方第五大道的车流化作彩色光轨。速度逐渐加快,镜头加入左右摆动,时而贴近布鲁克(BRKR)林红砖建筑擦过复古空调(884113)外机,时而摆向写字楼混凝土横梁,轨迹呈失控螺旋下坠。每经过一层平台,镜头随机偏转,仿佛被气流撞击,在狭窄空间中不断反弹、修正、偏离,偶尔掠过悬挂的霓虹招牌与街头涂鸦。下坠至中段,光线急剧衰减,虚拟暗光增强捕捉到老旧楼宇剥落的墙面、锈蚀的消防管道、杂乱的电缆。镜头开始沿光轴 360 度连续翻滚,天井四壁(一边是现代玻璃幕墙,一边是布鲁克(BRKR)林红砖墙)化作旋转的红与银的漩涡,偶尔闪现的Bagel店暖光、街头路灯如深渊中的孤岛。接近底部最后十米,速度极限,旋转平息,镜头重新垂直俯冲。即将撞击地面的瞬间,穿透无形镜面,重力方向倒置—从向下俯冲无缝切换为向上浮升,轨迹呈现莫比乌斯环式转折。进入镜像世界,镜头保持向前惯性,在倒置的纽约上空水平滑行。布鲁克(BRKR)林褐石屋、曼哈顿公寓屋顶群在脚下绵延至天际线,天空被踩在上方,两名倒悬的街头咖啡师(手持咖啡壶、吆喝声仿佛从天际传来)缓缓飘过。镜头优雅穿梭于漂浮的纸杯咖啡、牛皮纸袋与Bagel之间,做小幅升降起伏,围绕玻璃球缓慢椭圆运动,最终平稳直线推进,缓缓贴近玻璃球表面—球体中倒映的无限递归城市景观(第五大道、帝国大厦、布鲁克(BRKR)林大桥交织)逐渐填满画面,速度降至每秒不足一厘米,在绝对静止中淡出至纯白。

I2V提示词:跳舞,转了一圈后,从卡通变成现实场景。

// 人物真实感强,面部表情有生命力

在人物面部细节的渲染上,HappyHorse实现了重要突破。五官比例协调、面部轮廓自然、表情生动不僵硬,已基本摆脱传统AI生成视频中常见的“一眼假”感,在真人剧、口播、社媒等人物密集场景中表现亮眼。

T2V提示词:【场景】冷白灯光打下的审讯室,金属桌面反光,烟灰缸里还有未熄的烟。 【主体】左侧【老刑警】西装褶皱,眼袋深重,手指慢慢敲着桌面;右侧【嫌疑人】双臂交叉,眼神游移,嘴角带着一丝不易察觉的轻蔑。 【运动】老刑警将一张照片缓缓推过桌面,嫌疑人眼神微微一顿又迅速移开;镜头低角度平推,捕捉两人手部与表情的细微对峙。 【音频】[老刑警,语速极慢,每个字像钉子]:"你知道我做这行多少年了吗。" [短暂沉默,烟灰缸上的烟细细飘散] [嫌疑人,轻飘飘,刻意漫不经心]:"跟我有关系吗。" [老刑警,不抬头,嘴角微动]:"有。因为我从没输过。"

// 中近景叙事能力突出

T2V提示词:清晨的山林小路上,镜头缓慢推进,一双鞋踩在略微潮湿的泥土和落叶上,发出轻微而清脆的“沙沙”声。周围只有微风吹过树叶的“簌簌”声,偶尔传来几声清脆的鸟鸣,远处还能听到溪水流动的细小水声。整段画面强调山林环境的安静、湿润和自然回响,环境音真实细腻。

// 灵活多样的创作体验

T2V提示词:请给我生成一段邵氏风格喜剧电影,欧美男士说中文,中国男人说英文。

HappyHorse也在持续进化,将持续提升生成视频的质量和表现力。

# 优势场景

HappyHorse 1.0在电商内容生产场景产品展示类视频,图生视频(I2V)的还原度高、成片质感优;在口播场景中,人物形象自然、指令遵循度高、画面构图整体视频质量获得较高的认可度。适用于产品广告、口播Vlog、电商创意展示等子场景。图生视频还原度高,适合电商素材的批量创意生产。

// 影视短剧制作

短剧制作是HappyHorse表现最为密集的场景之一。模型在仿真人剧的情感表演细节、光影氛围营造、角色一致性维持等方面均展现出较强能力,在海外真人剧场景中的面部质感也表现优秀。

I2V提示词:A boy and the rusty Robot(LAWR) stand under the cool glow of the full moon, gently holding hands with a deep bond; a tight close-up captures the boy looking sincere and kind, his lips moving softly to whisper, "we are friends"; the Robot(LAWR)'s luminous eyes flicker and pulse as it processes the message, responding in a stuttering, mechanical electronic voice, "we... are, we... are friends"; hearing this, the boy's expression lights up with pure joy, and he reaches out his hand to kindly stroke and pat the Robot(LAWR)'s weathered metal head; the camera pulls back to a wide shot.

I2V提示词:Cinematic western standoff. A sun-bleached desert outpost with wind whistling through cracked, weather-beaten wooden slats. Two cowboys stand in a tense, physical confrontation, facing each other with hands hovering tensely over their holsters. In the far distance, dust devils dance across the shimmering, heat-distorted horizon. Extreme close-ups capture the sweat on their brows, the grit of their skin, and the subtle, rhythmic trembling of their fingers near the gun belts. The dialogue plays out in the tension: The older cowboy spits on the ground, 'You kept your word.' The younger one replies sharply, 'I kept my promise.' The older man narrows his eyes, 'The price is too high.' The younger one looks him straight in the eye, 'It’s my price to pay.' The older man exhales, 'Then draw.' The younger one whispers, 'As you wish.' The aesthetic is gritty and Leone-Inspired(INSE), featuring sharp high-contrast visuals, a palette of sepia and burnt orange, deep dramatic shadows, 35mm film grain, and a heavy, thick atmosphere of impending violence.

// 社媒创意视频

HappyHorse擅长生成具有高传播力的视觉内容。无论是产品种草、品牌故事、热点借势还是达人混剪,模型均能快速产出画面精良、节奏紧凑的短视频素材,帮助创作者降低制作门槛、提升内容吸引力与分发效率。

I2V提示词:菠萝摆了几个可爱的pose,然后用河南话说:老乡,你吃饭了没,要不要吃美味的大菠萝。

// 国际化与出海场景

HappyHorse在海外内容创作场景中已初步验证,在真人剧面部质感、人物表情自然度、空镜与慢动作光影表现等方面均获得正面反馈,具备服务全球化内容生产的基础能力。

T2V提示词:【场景】奢华的私人飞机机舱内,窗外是壮丽的金红色的云海落日,阳光将机舱渲染成琥珀色。【主体】左侧满头银发的 [ 年长男性 ] 身穿高定西装,手持威士忌酒杯,目光如鹰般锐利;右侧的 [ 年轻男性 ] 身体微微前倾,眉头微皱,神情既紧张又充满野心。【运动】年长男性轻轻晃动着手中的酒杯,液体挂壁,他身体逼近对方;年轻男性深吸一口气,眼神坚定地回视。镜头缓慢侧推,聚焦两人之间紧绷的张力。【音频】[ 年长男性, 低沉沙哑, 充满威严 ] 说道:“In this world, you either hunt or you become the prey. Which one are you?” [ 年轻男性, 嗓音紧绷但坚定 ] 回答:“I am the one(STKS) who pulls the trigger.” 背景伴随着飞机引擎深沉的轰鸣声和冰块撞击玻璃杯的清脆声。

免责声明:风险提示:本文内容仅供参考,不代表同花顺观点。同花顺各类信息服务基于人工智能算法,如有出入请以证监会指定上市公司信息披露平台为准。如有投资者据此操作,风险自担,同花顺对此不承担任何责任。
homeBack返回首页
不良信息举报与个人信息保护咨询专线:10100571违法和不良信息涉企侵权举报涉算法推荐举报专区涉青少年不良信息举报专区

浙江同花顺互联信息技术有限公司版权所有

网站备案号:浙ICP备18032105号-4
证券投资咨询服务提供:浙江同花顺云软件有限公司 (中国证监会核发证书编号:ZX0050)
AIME
举报举报
反馈反馈