3月27日讯,据外媒TechCurnch报道,音频技术初创公司Krisp于近日推出了一项创新的AI口音转换功能。该功能使用户能够在通话过程中实时改变自己的口音,目前首个版本已实现将印度英语口音成功转化为美式英语发音。
据Krisp官方介绍,这项技术的核心在于不改变用户原有声音特质,而是通过调整发音中的音素来匹配目标口音的特征。这种处理方式既保持了说话者的独特性,又能实现流畅的语音转换。目前,该功能已进入Beta测试阶段,并集成至Krisp桌面应用程序中,用户可在通话前或通话过程中随时启用这一功能。
谈及开发初衷,Krisp联合创始人阿尔托·米纳相分享了一段个人经历。他表示:”尽管我的英语水平已经非常流利,但在跨文化交流中,依然会遇到因口音差异导致的沟通障碍。这让我意识到,如果能够改变口音,可能会让交流变得更加顺畅。正是基于这样的观察,我们从两年前开始专注于这一技术的研发,并终于推出了Beta版本。”
尽管目前功能已初步成型,但TechCurnch的测试结果显示,转换后的声音在自然度和准确性上还有提升空间,偶尔会出现漏词现象。对此,Krisp团队解释称,该功能仍处于早期测试阶段,后续会通过持续优化模型来改进用户体验。
值得注意的是,在企业应用场景中,这项技术已展现出显著效果:Beta测试数据显示,使用该功能的销售转化率提升了26.1%,每本书的收入也增加了14.8%。这一数据有力地证明了语音转换技术在商业沟通中的潜在价值。
关于选择印度英语作为首个支持口音的原因,Krisp团队指出,这与印度在全球 STEM 领域中的人才占比密切相关。据统计,印度籍从业者在全球科学、技术、工程和数学领域占据了相当比例。因此,为这一群体提供更高效的沟通工具具有重要意义。未来,公司计划继续扩展功能,增加包括菲律宾英语在内的更多口音选项。
在技术研发方面,Krisp表示其训练模型基于数千份不同口音和方言的语音样本,并结合用户授权使用的会议数据进行优化。特别值得一提的是,这项技术无需用户预先提供语音数据,而是能够在通话过程中实时生成个性化的语音模型。这一特点使得功能更加灵活便捷,同时也保护了用户的隐私。