近日,国内AI公司阶跃星辰正式开源其图像编辑大模型Step1X-Edit,该模型在性能上达到当前开源领域的最先进水平。作为一款具有强大功能的AI工具,Step1X-Edit采用了先进的混合架构设计,总参数量达190亿(包含70亿参数的多语言大规模预训练模型MLLM和120亿参数的DiT模块),展现出卓越的技术实力。
为了方便开发者快速上手,Step1X-Edit提供了完整的开源代码和相关文档。以下是获取该模型的主要渠道:
-
GitHub:https://github.com/stepfun-ai/Step1X-Edit
-
Hugging Face:https://huggingface.co/stepfun-ai/Step1X-Edit
-
ModelScope:https://www.modelscope.cn/models/stepfun-ai/Step1X-Edit/summary
-
技术报告:https://arxiv.org/pdf/2504.17761
作为一款专注于自然语言图像编辑的AI模型,Step1X-Edit展现了三大核心技术优势:
-
智能解析能力:系统能够理解并执行复杂的自然语言指令,支持多轮对话式编辑,无需用户使用固定模板。同时具备强大的文本识别与改写功能。
-
稳定的身份特征保持:经过优化的算法能够在图像编辑后有效保留人物的身份特征(如人脸、姿态等),特别适合虚拟人制作、电商模特照片处理及社交平台内容生成等场景。
-
精准区域控制:支持用户对特定区域进行文字替换、材质变换和色彩调节等操作,同时保持整体图像风格的统一性和协调性,为用户提供更精细的编辑体验。
© 版权声明
文章版权归作者所有,未经允许请勿转载。