Qwen-Image-Edit-2511开源上线:提升角色一致性,增强几何推理

AI资讯2个月前发布 ainav
43 0

12月25日讯,阿里通义Qwen团队于12月23日正式发布全新图像编辑模型——Qwen-Image-Edit-2511。相较于前代产品Qwen-Image-Edit-2509版本,该模型在多个关键领域实现了技术突破:显著减轻了图像漂移问题、提升了人物形象的一致性表现、集成了先进的LoRA技术能力,并进一步强化了其在工业设计生成和几何推理方面的性能。

作为通义家族在视觉生成技术领域的最新成果,Qwen-Image-Edit-2511模型专注于解决图像编辑这一特定场景下的技术难题。与传统的文本生成图片(Text-to-Image)模型不同,该工具的核心功能在于对原图进行精准区域修改,同时保持主体结构的完整性。这种创新性的解决方案为开发者和设计师提供了一个更高效、更智能的AI辅助工具。

该模型最为突出的功能是其强大的指令解析能力(Instruction Following)。用户无需具备专业的Photoshop操作技能或复杂的图像处理知识,只需通过输入自然语言指令,例如“将画面中的猫换成狗”或“移除背景中的路人”,模型即可准确理解意图并执行相应的编辑操作。这种直观的交互方式极大地降低了使用门槛。

Qwen-Image-Edit-2511通过深度整合视觉编码器与先进语言模型,实现了对图像中语义对象的精准识别和定位。在进行目标物体修改的同时,该模型能够有效保持原图的光影效果、纹理特征以及背景的一致性,从而确保编辑后的图片质量得到最大程度的保留。

在人物形象处理方面,Qwen-Image-Edit-2511实现了重要突破。该模型能够在保留主体身份特征和视觉风格的前提下,根据输入的人像进行富有创造性的编辑。例如,可以将两位独立拍摄的人物图像无缝融合成一张协调的群像照片:

Qwen-Image-Edit-2511开源上线:提升角色一致性,增强几何推理

此外,该模型还显著提升了多人合影场景中人物形象的一致性表现。通过高保真的图像融合技术,可以将两张独立的人物图像转化为一张协调统一的群像照片:

Qwen-Image-Edit-2511开源上线:提升角色一致性,增强几何推理

为了进一步提升用户体验,Qwen-Image-Edit-2511将部分精选的热门LoRA功能直接集成到基础模型中。例如,在启用光照增强 LoRA 后,用户可以轻松实现对图像光线效果的精准控制:

Qwen-Image-Edit-2511开源上线:提升角色一致性,增强几何推理

在设计辅助功能方面,Qwen-Image-Edit-2511引入了更强大的几何推理能力。例如,可以直接为设计或标注目的生成辅助构造线:

Qwen-Image-Edit-2511开源上线:提升角色一致性,增强几何推理

© 版权声明

相关文章