Mistral Mini 3 —— 来自Mistral AI的一款开放源代码大型语言模型

AI工具1年前 (2025)发布 ainav

3,813 0 0

Mistral Small 3指的是什么

Mistral Small 3 是由 Mistral AI 开源的一款大型语言模型，它拥有240亿个参数，并遵循 Apache 2.0 许可证。该模型特别适用于低延迟的应用场景，并支持多种语言（如英语、中文和日语）。在推理能力和多语言处理上表现出色。其架构基于 Transformer 模型，共有40层，且具备32k的上下文窗口长度，能够应对较长文本输入的需求。此外，在本地进行推理时经过了优化，能够在配备 RTX 4090 GPU 或者拥有32GB内存的笔记本电脑上运行流畅。这款模型非常适合用于对话式AI系统、自动化任务以及专业应用领域。

Mistral Small 3的核心特性

优化低延时Mistral Small 3 被特别设计用于低延迟的应用环境，非常适合那些需要迅速响应的场景，比如虚拟助手、自动化的流程控制以及实时的人工智能应用中使用。相较于在相同硬件配置下运行的 Llama 3.3 70B 模型，其推理速度提升了超过三倍。
高效率性能这款拥有 240亿参数的模型，在性能上能与 Llama 3.3 的70B及Qwen的32B等大型模型相匹敌。它在MMLU基准测试中的准确率超过了81%，并且处理速度达到了每秒150个token。
多种语言兼容性支持本服务涵盖多种语言选项，如英语、法语、德语、西班牙语、意大利语以及亚洲语言中的中文、日語和韓語等。
现场安装能力适用于需要严格保护数据隐私的场合，能够在搭载单张 NVIDIA RTX 4090 图形卡或是拥有 32GB 运行内存的 MacBook 设备上执行。
开放源代码及高度可配置性依照 Apache 2.0 开源许可协议，开发人员能够自由地改编与实施该软件，并且非常适合用于企业的应用程序。
命令执行及逻辑推断技能通过细微调整指令后，能够理解并完成多种任务，涵盖代码创作、数学运算以及普通知识的解答。