字节跳动推出Seed LiveInterpret同声传译模型

AI工具1年前 (2025)发布 ainav

250 0 0

什么是Seed LiveInterpret 2.0

Seed LiveInterpret 2.0是由字节跳动的Seed团队开发的一款创新性实时语音翻译解决方案。作为一款端到端的同声传译模型，它支持中英文双语种之间的即时转换。该系统不仅具备接近专业人类同传的高水准翻译准确率，更实现了超低延迟的输出效果，能够实现”听即翻译、边听边译”的实时交互体验。

Seed LiveInterpret 2.0基于先进的全双工语音生成与理解架构，支持多人同时参与对话，并能实时还原说话人的独特音色特征。无需事先采集任何声音样本，系统就能通过AI算法智能复刻每个人的声音特点。在面对复杂多变的场景时，该模型依然能保持70%以上的翻译准确率；而对于单人演讲等相对简单的应用场景，准确率更是高达80%以上。

值得一提的是，Seed LiveInterpret 2.0在语音转换方面的表现尤为突出，其平均语音到语音延迟控制在了2-3秒的水平，相比传统同声传译系统降低了超过60%的时间延迟。这种智能平衡翻译质量与实时性的能力，使其能够灵活适应各种不同的语音输入条件和场景需求。

目前，Seed LiveInterpret 2.0已经通过火山引擎实现了对外开放服务，为开发者和企业提供了强大的实时翻译技术支持。