Stable Audio 2.5 发布：企业级音频生成 AI 模型，3 分钟曲目仅需 2 秒完成

152 0 0

近日，人工智能领域的领军企业Stability AI正式推出了其最新版本的企业级音频生成模型——Stable Audio 2.5。

作为Stability AI在音频生成领域的重要突破，此次发布的Stable Audio 2.5版本主要围绕音乐生成能力和效率进行了全面优化。据官方介绍，该模型不仅能够准确解析提示词中的情绪描述和音乐风格信息，还能智能构建完整的多段式音乐结构，包括前奏、发展与结尾等专业编曲元素，展现出更贴近实际音乐制作的逻辑性。

在技术层面，Stable Audio 2.5采用了创新的后训练方法ARC（Adversarial Relativistic-Contrastive），通过结合相对式对抗训练与对比判别器的独特设计，显著提升了音频生成效率。得益于此项技术突破，新模型不仅能够在短短2秒钟内完成3分钟高质量音频内容的生成，更在音轨质量上达到了新的高度，实现了效率与效果的最佳平衡。

值得注意的是，Stable Audio 2.5还新增了实用的音频修复功能。用户只需上传现有音频文件，并指定需要延展的部分，模型就能根据上下文内容和整体曲风智能扩展音频长度，这对于音乐制作、后期剪辑等应用场景具有重要意义。

目前，Stable Audio 2.5已全面开放试用，用户可通过其官方网站体验这一创新技术。为保护知识产权，平台特别设置了版权内容识别系统，确保上传的音频文件不包含未经授权的作品，以此维护良好的创作环境。

# AI资讯