Stability AI发布Stable Diffusion 3 Medium文本转图像模型的源代码

AI工具1年前 (2025)发布 ainav

261 0 0

6月12日傍晚传来消息，人工智能新兴企业Stability AI宣告其最新研发的文字转图片生成工具——Stable Diffusion 3 Medium（SD3 Medium）正式开放源代码。这款模型拥有20亿个参数，标志着Stability AI在文字转图像的开源技术上达到了新高度。通过减少VRAM的需求量，该模型能够更有效地运行于普通消费者级别的GPU和企业级的GPU设备之上。

Stability AI的稳定扩散模型3中等版本可在Hugging Face上找到，其链接为：https://huggingface.co/stabilityai/stable-diffusion-3-medium

关于Stable Diffusion 3 Medium的核心资料

前沿性SD3 Medium 配备了20亿个参数，作为Stability AI迄今为止结构最复杂的图像创造工具，它标志着生成式人工智能发展中的一个重大进步。
适用范围该模型的大小恰到好处，非常适合在个人计算机、笔记本和企业级别的图形处理器上运行，极有可能树立文本转图像技术的新标杆。
公开性SD3 Medium 的权重现可在非商用授权及低成本创作人授权下获取，此举旨在促进专业艺术家、设计师、开发者与AI爱好者的商业化应用。
跨平台兼容性支持提供API试验功能，在Stability平台、 Stable Assistant（享有三日免费体验）以及通过Discord上的Stable Artisan进行测试。

Medium版本的Stable Diffusion 3优化

达到照片般的逼真效果SD3 Medium 能够降低手部和面部常见的伪影现象，使得用户可以轻松获得高品质图像而不需要经历复杂的处理步骤。
依据指示进行调整该模型具备解析及创造包含空间布局、构成要素、行为动态与艺术风格等多方面细节的复合型指令的能力。
布局技能通过采用Diffusion Transformer结构，SD3 Medium 确保了在创建文本过程中没有伪影和拼写失误。
效能利用该模型的开发注重资源利用效率，在普通消费者级别的GPU上亦能实现高效运行，同时确保不会降低其性能表现。
精细调整的能力SD3 Medium 具备从有限的数据集中捕捉细节的能力，从而极大地增强了其定制化的潜力。

合作方

英伟达Stability AI 和 NVIDIA 达成的合作利用了NVIDIA® RTX™ GPU及TensorRT™技术，大幅提升了包括SD3 Medium在内的所有Stable Diffusion模型的性能表现。
超微半导体（AMD）AMD 优化了 SD3 Medium，旨在使其在 AMD 最新的 APU、消费者级别的 GPU 以及 MI-300X 企业级 GPU 上实现高效的推理性能。