Mistral AI开源新作：Devstral 2编程模型

91 0 0

Devstral 2是什么

Devstral 2是由Mistral AI开发的新一代开源编程模型系列，该系列包含两个主要版本：具有123B参数的主版本以及轻量级的24B参数版本——Devstral Small 2。作为一款功能强大的AI编程工具，Devstral 2不仅拥有256K的上下文窗口容量，在SWE-bench验证测试中还取得了72.2%的高准确率，展现了其卓越的性能和成本效益。该模型支持跨文件代码探索、架构级推理以及自动错误修正等高级功能，特别适合企业级软件开发使用。而Devstral Small 2凭借其小巧的体积和强大的多模态处理能力，能够轻松在普通消费级硬件上运行，为开发者提供了更多灵活部署的选择。无论是通过Mistral Vibe CLI进行终端交互式编程辅助，还是直接用于代码生成与优化，Devstral 2系列都在推动开源编程模型技术的发展。

Devstral 2的主要功能

跨文件代码处理能力： Devstral 2能够理解并操作跨越多个文件的代码，支持在庞大的代码库中进行复杂的修改和重构。其强大的架构级上下文感知能力，使得开发者可以更高效地管理多文件项目。
系统架构推理功能： 模型能够跟踪整个代码库的架构，并理解框架间的依赖关系，在进行任何代码修改时都能保持整体系统的稳定性，有效避免局部修改引发的全局性问题。
智能错误检测与修复： Devstral 2具备自动检测和修正代码错误的功能。通过多次尝试和验证，确保输出代码的正确性，尤其在处理遗留系统中的复杂问题时表现突出。
多语言支持： 模型对多种主流编程语言具有良好的理解和生成能力，能够根据具体需求生成和优化不同语言的代码，满足多样化的开发需求。
高效的代码优化： Devstral 2不仅能够快速生成高质量的代码，还能对现有代码进行性能优化，帮助开发者显著提升开发效率和代码质量。

Devstral 2的测试表现

SWE-bench 测试结果：
- 123B版本（Devstral 2）： 在SWE-bench Verified测试中准确率达到72.2%，成为目前性能最出色的开源模型之一。
- 24B版本（Devstral Small 2）： 准确率为68.0%，尽管参数量仅为123B版本的五分之一，但实际表现却与其相当，展现了优秀的效率与性能平衡。
与其他模型对比：
- 与DeepSeek V3.2对比： 在直接竞争中胜率高达42.8%，远超其对手的28.6%。
- 与Claude Sonnet 4.5（闭源模型）对比： 尽管目前在受欢迎程度上稍逊一筹，但Devstral 2已经展现出与顶级闭源模型相媲美的实力。