Mistral 发布 Voxtral 系列语音理解模型:高效准确的开源方案

AI资讯1天前发布 ainav
3 0

7月16日讯,在昨日的发布会上,Mistral AI正式推出了其全新的语音理解模型——Voxtral。这一系列模型采用了开源的形式发布,以更具竞争力的价格提供卓越的低错误率表现,并着重强调了对现实世界语音智能应用的支持。

Voxtral系列基于Mistral Small 3.1打造,涵盖了专为生产环境设计的24B参数模型Voxtral Small以及适用于本地和边缘设备部署的3B参数版本Voxtral Mini。此外,该系列还包括专注于语音转写功能的Voxtral Mini Transcribe。

值得注意的是,Voxtral模型支持最长32K Token的上下文长度,能够处理时长达到30分钟的音频转录和40分钟的音频理解任务。该模型还集成了生成相关问题、结构化摘要等功能,并且支持包括英语、西班牙语、法语在内的多种印欧语言。

Mistral 发布 Voxtral 系列语音理解模型:高效准确的开源方案

在性能方面,Mistral AI表示Voxtral Mini Transcribe在成本敏感型应用场景中展现出超越OpenAI Whisper的优势,同时其价格仅为后者的不到一半。而在处理高级用例时,Voxtral Small的表现可与行业领先的ElevenLabs Scribe相媲美,且价格同样更为亲民。

© 版权声明

相关文章