Qwen-Image-Edit-2511开源上线：提升角色一致性，增强几何推理

173 0 0

12月25日讯，阿里通义Qwen团队于12月23日正式发布全新图像编辑模型——Qwen-Image-Edit-2511。相较于前代产品Qwen-Image-Edit-2509版本，该模型在多个关键领域实现了技术突破：显著减轻了图像漂移问题、提升了人物形象的一致性表现、集成了先进的LoRA技术能力，并进一步强化了其在工业设计生成和几何推理方面的性能。

作为通义家族在视觉生成技术领域的最新成果，Qwen-Image-Edit-2511模型专注于解决图像编辑这一特定场景下的技术难题。与传统的文本生成图片（Text-to-Image）模型不同，该工具的核心功能在于对原图进行精准区域修改，同时保持主体结构的完整性。这种创新性的解决方案为开发者和设计师提供了一个更高效、更智能的AI辅助工具。

该模型最为突出的功能是其强大的指令解析能力（Instruction Following）。用户无需具备专业的Photoshop操作技能或复杂的图像处理知识，只需通过输入自然语言指令，例如“将画面中的猫换成狗”或“移除背景中的路人”，模型即可准确理解意图并执行相应的编辑操作。这种直观的交互方式极大地降低了使用门槛。

Qwen-Image-Edit-2511通过深度整合视觉编码器与先进语言模型，实现了对图像中语义对象的精准识别和定位。在进行目标物体修改的同时，该模型能够有效保持原图的光影效果、纹理特征以及背景的一致性，从而确保编辑后的图片质量得到最大程度的保留。

在人物形象处理方面，Qwen-Image-Edit-2511实现了重要突破。该模型能够在保留主体身份特征和视觉风格的前提下，根据输入的人像进行富有创造性的编辑。例如，可以将两位独立拍摄的人物图像无缝融合成一张协调的群像照片：