近日,科技媒体Windows Latest发布消息称,微软在其Copilot Labs平台推出了全新的AI语音生成工具——COPilot Audio Expressions。
该工具旨在提升语音生成的质量,使输出的音频更接近真实人声。用户无需注册即可直接体验其功能,并可将生成的MP3格式音频下载到本地设备中使用。
目前,COPilot Audio Expressions提供了两种主要模式:Emotive(情感表达)和Story(故事创作)。这两种模式分别针对不同的应用场景进行了优化。
在Emotive模式下,用户可以选择不同的音色和叙述风格。例如,在测试过程中,使用“Oak”音色和“narration”叙述风格,并输入模拟火车站场景的脚本内容。
生成的语音不仅准确朗读了输入文本,还会自动添加细节描述并优化措辞,使整体表达更加生动自然。每段音频的最大长度为59秒,并支持多种声音与风格组合。
Story模式则更为智能,系统会自动选择合适的音色和叙述风格。用户仅需提供主题提示即可完成内容生成。
例如,当输入“讲述一只猫在夜晚潜行觅食的故事”时,AI会生成一个长达90秒的多角色叙述:旁白使用美式口音,而猫的对白则采用英式口音。这种创新性的语言切换使对话更加自然流畅。
测试显示,在情节构建、角色区分以及声音融合度方面,Story模式表现尤为出色。生成的语音不再局限于单调的机器朗读,而是呈现出类似专业配音的效果。这表明该工具不仅适合简单的文本朗诵,也可用于复杂的多角色创意作品制作。
值得注意的是,目前COPilot Audio Expressions仅支持英文内容生成。对于中文及其他语言的用户来说,尚无法直接获取母语语音输出。微软方面尚未透露是否会增加对其他语言的支持。
© 版权声明
文章版权归作者所有,未经允许请勿转载。