Mistral 发布 Voxtral 系列语音理解模型：高效准确的开源方案

AI资讯1年前 (2025)发布 ainav

232 0 0

7月16日讯，在昨日的发布会上，Mistral AI正式推出了其全新的语音理解模型——Voxtral。这一系列模型采用了开源的形式发布，以更具竞争力的价格提供卓越的低错误率表现，并着重强调了对现实世界语音智能应用的支持。

Voxtral系列基于Mistral Small 3.1打造，涵盖了专为生产环境设计的24B参数模型Voxtral Small以及适用于本地和边缘设备部署的3B参数版本Voxtral Mini。此外，该系列还包括专注于语音转写功能的Voxtral Mini Transcribe。

值得注意的是，Voxtral模型支持最长32K Token的上下文长度，能够处理时长达到30分钟的音频转录和40分钟的音频理解任务。该模型还集成了生成相关问题、结构化摘要等功能，并且支持包括英语、西班牙语、法语在内的多种印欧语言。

在性能方面，Mistral AI表示Voxtral Mini Transcribe在成本敏感型应用场景中展现出超越OpenAI Whisper的优势，同时其价格仅为后者的不到一半。而在处理高级用例时，Voxtral Small的表现可与行业领先的ElevenLabs Scribe相媲美，且价格同样更为亲民。

# AI资讯