6月12日傍晚传来消息,人工智能新兴企业Stability AI宣告其最新研发的文字转图片生成工具——Stable Diffusion 3 Medium(SD3 Medium)正式开放源代码。这款模型拥有20亿个参数,标志着Stability AI在文字转图像的开源技术上达到了新高度。通过减少VRAM的需求量,该模型能够更有效地运行于普通消费者级别的GPU和企业级的GPU设备之上。
Stability AI的稳定扩散模型3中等版本可在Hugging Face上找到,其链接为:https://huggingface.co/stabilityai/stable-diffusion-3-medium
关于Stable Diffusion 3 Medium的核心资料
- 前沿性SD3 Medium 配备了20亿个参数,作为Stability AI迄今为止结构最复杂的图像创造工具,它标志着生成式人工智能发展中的一个重大进步。
- 适用范围该模型的大小恰到好处,非常适合在个人计算机、笔记本和企业级别的图形处理器上运行,极有可能树立文本转图像技术的新标杆。
- 公开性SD3 Medium 的权重现可在非商用授权及低成本创作人授权下获取,此举旨在促进专业艺术家、设计师、开发者与AI爱好者的商业化应用。
- 跨平台兼容性支持提供API试验功能,在Stability平台、 Stable Assistant(享有三日免费体验)以及通过Discord上的Stable Artisan进行测试。
Medium版本的Stable Diffusion 3优化
- 达到照片般的逼真效果SD3 Medium 能够降低手部和面部常见的伪影现象,使得用户可以轻松获得高品质图像而不需要经历复杂的处理步骤。
- 依据指示进行调整该模型具备解析及创造包含空间布局、构成要素、行为动态与艺术风格等多方面细节的复合型指令的能力。
- 布局技能通过采用Diffusion Transformer结构,SD3 Medium 确保了在创建文本过程中没有伪影和拼写失误。
- 效能利用该模型的开发注重资源利用效率,在普通消费者级别的GPU上亦能实现高效运行,同时确保不会降低其性能表现。
- 精细调整的能力SD3 Medium 具备从有限的数据集中捕捉细节的能力,从而极大地增强了其定制化的潜力。
合作方
- 英伟达Stability AI 和 NVIDIA 达成的合作利用了NVIDIA® RTX™ GPU及TensorRT™技术,大幅提升了包括SD3 Medium在内的所有Stable Diffusion模型的性能表现。
- 超微半导体(AMD)AMD 优化了 SD3 Medium,旨在使其在 AMD 最新的 APU、消费者级别的 GPU 以及 MI-300X 企业级 GPU 上实现高效的推理性能。
敞开与保障安全性
- Stability AI 专注于开发开源性质的生成式人工智能,并在稳定性非商用研究社区许可协议下发布了SD3 Medium。此外,还引入了创作者许可证来促进其商业应用。
- 企业实施了一整套的安全策略,覆盖从模型培训至应用全过程,以保障SD3 Medium 使用的安全性和责任感。
未来的规划
Stability AI 打算依据用户的建议不断优化SD3 Medium,并增强其特性与效能。该企业的愿景在于重新定义由AI创作的艺术作品的标准,从而使SD3 Medium成为专家及业余爱好者的必备资源。
(信息出处:Stability AI)
© 版权声明
文章版权归作者所有,未经允许请勿转载。