阿里发布图像转视频模型I2VGen-XL

259 0 0

I2VGen-XL指的是什么

I2VGen-XL 是由阿里巴巴达摩院开发的一款开源模型，专注于从图像生成视频的过程。它采用了一种创新的级联扩散技术，能够将文本与视频内容以及视频结构分离处理，并借助静态图片作为主要引导元素来维持输入数据的一致性，从而实现高质量动态视频的合成。这种技术手段有效地应对了AI在进行视频合成时遇到的语义精确度、清晰度及时间空间连贯性的难题。

I2VGen-XL的主要特点与功能

将图片序列转换为视频用户提供一张静态图片及相关的文字说明后，该模型能够创建出与其提供的图片内容及其含义紧密匹配的动态视频。
创建高清晰度的宽屏幕视频I2VGen-XL 可以创建分辨率高达1280*720且保持16:9屏幕比例的清晰视频，极大提升了用户的视觉享受质量。
时间顺序一致由模型创建的视频在时间线上表现出一致性，确保了影片内容的顺畅及观看起来更加愉悦。
具有优秀的质地和丰富的细节。I2VGen-XL 着重于在视频合成时保持细节并增强材质的真实感，从而创造出既逼真又富有艺术美感的影像内容。

怎样运用I2VGen-XL

I2VGen-XL的官方网站位于：https://i2vgen-xl.github.io/，其GitHub仓库地址是：https://github.com/ali-vilab/i2vgen-xl，相关研究论文可在以下链接找到：https://arxiv.org/abs/2311.04145。对于普通用户而言，可以通过访问Hugging Face或ModelScope魔搭社区的演示来在线体验这一项目。

浏览I2VGen-XL演示页面的两种版本（Hugging Face链接为：https://huggingface.co/spaces/modelscope/I2VGen-XL；ModelScope链接为：https://www.modelscope.cn/studios/damo/I2VGen-XL-Demo/summary）
挑选适当的图像并上传（推荐使用1:1的比例的图片），之后请点击「创建视频」。
当初始创建的视频基本完成时，接下来应为其加入英文文字说明。
选择「创建高清视频」选项，大约等待两分钟后，您的视频就会准备就绪。

# AI工具