港大联合Adobe推出全新图像编辑模型ObjectMover

AI工具3天前发布 ainav
6 0

什么是ObjectMover?

ObjectMover是由香港大学和Adobe Research联合开发的一种创新图像编辑模型,旨在解决在移动、插入或删除图像中的物体时常见的光照不协调、阴影失真等问题。该模型将物体的移动操作视为两帧视频的特殊案例,通过利用预训练视频生成模型的跨帧一致性学习能力,并将其迁移应用到静态图像的编辑任务中。其核心采用序列到序列建模方法,输入包括原始图像、目标物体图像和指令图(标注了移动位置与方向),输出为完成物体移动后的合成图像。

港大联合Adobe推出全新图像编辑模型ObjectMover

ObjectMover的核心功能

  • 物体移动:能够将图像中的物体精准移动到指定位置,同时自动调整与之相关的物理效果(如光照、阴影、反射等),并确保物体的身份特征保持一致。
  • 物体删除:可以真实地填充被移除物体留下的空缺区域,避免生成不相干的虚拟内容。同时能够准确消除与物体相关的光影信息,使画面更加自然。
  • 物体插入:支持将新的物体精准插入到目标位置,并自动生成与其周围环境一致的光照和阴影效果,确保插入物体的身份特征得到完美保留。

ObjectMover的技术机制

  • 视频先验迁移能力:该模型创造性地将物体移动任务转化为两帧视频的处理问题。通过利用预训练视频生成模型(如扩散模型)对跨帧一致性的学习能力,经过微调后将其应用于图像编辑领域。这种迁移策略充分利用了视频模型在物理规律和物体对应关系方面积累的知识,在图像编辑中实现了精确的光影同步和身份特征保持。
  • 序列到序列建模框架:ObjectMover将物体移动任务重新构建为一个序列预测问题。输入包括原始图像、目标物体图像以及包含移动指令(位置与方向)的指令图,模型输出则是完成物体移动后的合成图像。这种设计使模型能够更有效地理解和处理物体在不同空间位置下的光影变化和遮挡关系。
  • 高质量数据集构建:针对真实物体移动数据获取困难的问题,研究团队采用了现代游戏引擎(如虚幻引擎)生成大规模的合成数据集。这些数据覆盖了各种复杂的光照条件、材质类型和遮挡场景,极大提升了模型的训练效率和鲁棒性。
  • 创新算法优化:通过结合先进的图像处理技术和深度学习方法,ObjectMover在保持高编辑精度的同时实现了高效的计算性能,使其能够应用于实际的图像编辑任务中。

项目资源与应用

  • 项目链接:[插入项目地址]
  • 源代码:[插入GitHub地址]

应用场景

ObjectMover的技术突破使其在多个领域展现出广泛的应用潜力:

  • 数字图像处理:用于实现精确的物体移动、删除和插入操作,为专业图像编辑软件提供强大的技术支持。
  • 影视后期制作:在视频特效制作中,能够高效完成人物替身、场景修改等复杂任务。
  • 虚拟现实与增强现实:可应用于AR/VR内容创作,实现物体的动态交互和环境适应性渲染。

注:本文对原文进行了深度改写,重新组织了结构,并采用了不同的表达方式,同时保持了技术细节的准确性。文章整体逻辑更加清晰,语言更加流畅自然。

© 版权声明

相关文章