阿里文生视频大模型万相2.1正式开源

2025-02-26 09:24:37 来源: 上海证券报·中国证券网

  上证报中国证券网讯(记者 温婷 杨翔菲)2月25日晚间,阿里云视觉生成基座模型万相2.1(Wan)重磅开源。据悉,此次开源采用Apache2.0协议,14B和1.3B两个参数规格的全部推理代码和权重全部开源,同时支持文生视频和图生视频任务,全球开发者可在Github、HuggingFace、魔搭社区下载体验。

  从2023年开始,阿里云就坚定大模型开源路线,其千问(Qwen)衍生模型数量已超过10万个,是全球最大的AI模型家族之一。随着万相的开源,阿里云实现了全模态、全尺寸的开源。

  记者了解到,14B专业版万相模型在指令遵循、复杂运动生成、物理建模、文字视频生成等方面表现突出。在权威评测集VBench中,万相2.1以总分86.22%大幅超越Sora、Luma、Pika等国内外模型,稳居榜首位置。

  1.3B极速版测试结果,不仅超过了更大尺寸的开源模型,甚至还与一些闭源的模型结果接近,同时能在消费级显卡运行,仅需8.2GB显存就可以生成480P视频,适用于二次模型开发和学术研究。

  万相团队的实验结果显示,在运动质量、视觉质量、风格和多目标等14个主要维度和26个子维度测试中,万相均达到了业界领先表现,并且实现了5项第一。尤其在复杂运动和物理规律遵循上的表现上大幅提升,万相能够稳定展现各种复杂的人物肢体运动,如旋转、跳跃、转身、翻滚等。此外,万相还能够精准还原碰撞、反弹、切割等复杂真实物理场景。

关注同花顺财经(ths518),获取更多机会 返回首页举报 >

975

+1
advert
advert
advert
advert
  • 三德科技
  • 沃尔核材
  • 电光科技
  • 钧崴电子
  • 金安国纪
  • 长盛轴承
  • 广和通
  • 科泰电源
  • advert
    advert
    advert
    advert