Stable Audio 2.5 发布:企业级音频生成 AI 模型,3 分钟曲目仅需 2 秒完成

AI资讯2个月前发布 ainav
38 0

近日,人工智能领域的领军企业Stability AI正式推出了其最新版本的企业级音频生成模型——Stable Audio 2.5。

Stable Audio 2.5 发布:企业级音频生成 AI 模型,3 分钟曲目仅需 2 秒完成

作为Stability AI在音频生成领域的重要突破,此次发布的Stable Audio 2.5版本主要围绕音乐生成能力和效率进行了全面优化。据官方介绍,该模型不仅能够准确解析提示词中的情绪描述和音乐风格信息,还能智能构建完整的多段式音乐结构,包括前奏、发展与结尾等专业编曲元素,展现出更贴近实际音乐制作的逻辑性。

在技术层面,Stable Audio 2.5采用了创新的后训练方法ARC(Adversarial Relativistic-Contrastive),通过结合相对式对抗训练与对比判别器的独特设计,显著提升了音频生成效率。得益于此项技术突破,新模型不仅能够在短短2秒钟内完成3分钟高质量音频内容的生成,更在音轨质量上达到了新的高度,实现了效率与效果的最佳平衡。

值得注意的是,Stable Audio 2.5还新增了实用的音频修复功能。用户只需上传现有音频文件,并指定需要延展的部分,模型就能根据上下文内容和整体曲风智能扩展音频长度,这对于音乐制作、后期剪辑等应用场景具有重要意义。

目前,Stable Audio 2.5已全面开放试用,用户可通过其官方网站体验这一创新技术。为保护知识产权,平台特别设置了版权内容识别系统,确保上传的音频文件不包含未经授权的作品,以此维护良好的创作环境。

© 版权声明

相关文章