阿里巴巴开源视频AI生成与编辑模型:通义万相 Wan2.1-VACE

AI资讯3天前发布 ainav
5 0

近日,据《科创板日报》报道,阿里巴巴正式宣布开源其最新视频生成与编辑模型——通义万相 Wan2.1-VACE。这一创新工具支持包括文生视频、图像参考视频生成、视频重绘、局部编辑、背景延展以及时长调节等多种基础功能。

阿里巴巴开源视频AI生成与编辑模型:通义万相 Wan2.1-VACE

此次开源版本包括1.3B和14B两个规模,其中1.3B版本专为消费级显卡优化设计,确保更广泛的用户能够便捷使用。

通义万相是阿里云推出的AI绘画创作系列模型之一,旨在通过技术手段辅助人类实现高质量图片创作。自2023年7月7日正式发布以来,该模型持续在图像生成领域发挥重要作用。去年9月,在2024年阿里云栖大会上,官方首次展示了其视频生成能力,并凭借生成影视级高清视频和对中国语言的精准理解而备受关注。

值得注意的是,通义万相在经历了技术升级后,于今年1月初正式发布2.1版本。此次升级显著提升了模型处理复杂运动场景、模拟真实物理现象、优化电影视觉效果以及增强对指令的响应能力等方面的表现。随后在2月25日,阿里巴巴对外宣布全面开源这一最新视频生成模型万相2.1。

© 版权声明

相关文章