北大与腾讯共同开发的精细图像编辑器DiffEditor

84 0 0

DiffEditor指的是什么？

北京大学深圳研究生院与腾讯PCG的研究团队开发了基于扩散模型（Diffusion Model）的图像编辑工具——DiffEditor。该工具利用文本提示及图像提示，并采用区域随机微分方程（Regional SDE）和技术时间旅行策略，大幅提升了其在处理图像时的精准度和灵活程度。它能够执行多种任务，如在同一图片内移动对象、改变大小或拖动内容，甚至可以在不同图片之间进行外观替换与粘贴物体等操作。

DiffEditor的核心特性

精细级别的图片修改DiffEditor具备处理图像的多种精细操作能力，涵盖：
- 物体的位置变动与尺寸调节用户能够选择并移动图像内的对象，或是更改其尺寸。
- 内容移动用户能够精准地移动图片内多个选定的像素点。
- 跨越图片的修改工作提供对象粘贴与外观变更功能，让用户能够把一幅图片里的物体移至另一幅图片上，或是更改物体的外貌。
随机区域微分方程(SDE)方法借助于在编辑区引入随机元素，DiffEditor能够维持其余部分的一致性，并增强编辑的灵活度。
不需要进一步的培训DiffEditor能够直接应用于各种具体的图像编辑任务中，无需额外的训练过程，并能保证高效的精确处理效果。
高效率与适应性DiffEditor利用自适应学习算法，能够依据多样化的编辑要求自行优化设置，以应对各类复杂图像处理工作。

DiffEditor的工作机制

图文结合的提示方法在DiffEditor中首次加入了图像提示功能，并将其与现有的文本提示结合使用，这样能够为用户提供更加详尽的内容说明。这种改进特别有助于提升编辑工作的精准度和效果，在处理复杂的编辑任务时表现尤为突出。
区域性随机微分方程（Area-based Stochastic Differential Equation, Area SDE）方法为增强编辑过程中的灵活度，DiffEditor引入了区段随机微分方程(SDE)的方法。该方法通过对特定区域应用随机变化，并确保其余部分的一致性来达成更为自然流畅的编辑结果。
时光穿越规划为提高编辑质量，DiffEditor采用了时间穿梭方法。此方法在一个扩散的时间步骤中实施环形指引机制，以此来优化修改结果，在确保内容一致性的前提下增强编辑的多样性与灵活度。
自动创建编辑遮罩DiffEditor能够依据文字提示自动创建并突出标注需修改的部分，并生成相应的编辑遮罩。此举省去了使用者自行设定遮罩的复杂步骤，大幅提升了编辑工作的效率。
传播取样及地域导向DiffEditor融合了随机微分方程(SDE)与常微分方程(ODE)的采样技术，并借助领域导向的梯度及时间操控策略来增强其编辑效能。