微软推出AI配音新功能：支持90秒多角色真人式语音合成

AI资讯11个月前发布 ainav

202 0 0

近日，科技媒体Windows Latest发布消息称，微软在其Copilot Labs平台推出了全新的AI语音生成工具——COPilot Audio Expressions。

该工具旨在提升语音生成的质量，使输出的音频更接近真实人声。用户无需注册即可直接体验其功能，并可将生成的MP3格式音频下载到本地设备中使用。

目前，COPilot Audio Expressions提供了两种主要模式：Emotive（情感表达）和Story（故事创作）。这两种模式分别针对不同的应用场景进行了优化。

在Emotive模式下，用户可以选择不同的音色和叙述风格。例如，在测试过程中，使用“Oak”音色和“narration”叙述风格，并输入模拟火车站场景的脚本内容。

生成的语音不仅准确朗读了输入文本，还会自动添加细节描述并优化措辞，使整体表达更加生动自然。每段音频的最大长度为59秒，并支持多种声音与风格组合。

Story模式则更为智能，系统会自动选择合适的音色和叙述风格。用户仅需提供主题提示即可完成内容生成。

例如，当输入“讲述一只猫在夜晚潜行觅食的故事”时，AI会生成一个长达90秒的多角色叙述：旁白使用美式口音，而猫的对白则采用英式口音。这种创新性的语言切换使对话更加自然流畅。

测试显示，在情节构建、角色区分以及声音融合度方面，Story模式表现尤为出色。生成的语音不再局限于单调的机器朗读，而是呈现出类似专业配音的效果。这表明该工具不仅适合简单的文本朗诵，也可用于复杂的多角色创意作品制作。

值得注意的是，目前COPilot Audio Expressions仅支持英文内容生成。对于中文及其他语言的用户来说，尚无法直接获取母语语音输出。微软方面尚未透露是否会增加对其他语言的支持。

文章版权归作者所有，未经允许请勿转载。

ainav

181 0

ainav

313 0

ainav

296 0

ainav

146 0

ainav

217 0

ainav

208 0