什么是MiniCPM 4.0
MiniCPM 4.0是由面壁智能最新开发的端侧大模型。该系列包括8B和0.5B两个版本,分别针对不同的应用场景进行了优化。
作为行业领先的创新成果,8B闪电稀疏版采用了独特的稀疏架构设计,在处理长文本任务方面表现尤为突出。而0.5B版本则凭借其低资源消耗和卓越性能,成为对计算能力要求不高的场景下的理想选择。
特别值得一提的是,自研的CPM.cu推理框架在各种应用场景下都展现出了显著的优势。在极限运行条件下,该框架可实现高达220倍的速度提升;即使在常规环境下,也能带来5倍性能提升的效果。
此外,MiniCPM 4.0完美兼容了多个主流开源平台和硬件架构。无论是vLLM、SGLang还是LlamaFactory等主流框架,亦或是Intel、高通、MTK、华为昇腾等芯片架构,该模型都已进行了深度适配。

MiniCPM 4.0开源模型全家桶
MiniCPM4-8B:作为该系列的旗舰级型号,拥有80亿参数量,并基于8T tokens规模进行训练。
MiniCPM4-0.5B:轻量化设计版本,包含0.5亿参数,在1T tokens的数据集上完成训练。
MiniCPM4-8B-Eagle-FRSpec:专为FRSpec任务优化的模型变体,显著提升了推理速度。
MiniCPM4-8B-Eagle-FRSpec-QAT-cpmcu:采用QAT技术的升级版,通过量化训练实现了推测与计算效率的双重提升。
MiniCPM4-8B-Eagle-vLLM:支持vLLM格式的推理加速版本,专门优化了预测性能。
MiniCPM4-8B-marlin-Eagle-vLLM:量化处理的vLLM格式模型,进一步提升了推理效率。
BitCPM4-0.5B:创新性地应用了三进制量化技术,在不损失性能的前提下将参数量减少了90%。
BitCPM4-1B:基于MiniCPM3-1B的优化版本,同样采用了高效的三进制量化技术,实现了显著的参数压缩效果。
MiniCPM4-Survey:集成在MiniCPM4-8B基础上的功能模块,能够根据用户提供的查询自动生成高质量的调查报告。
MiniCPM4-MCP:基于8B基础模型构建的专业工具,支持用户输入查询及多种MCP工具,并能自动调用相关功能满足需求。
MiniCPM 4.0的核心特色
- 智能切换注意力模式: MiniCPM 4.0-8B版本可根据具体任务类型自动调节注意力机制。在处理长文本时启用稀疏注意力,有效降低计算复杂度;而在短文本场景下,则会自动切换到稠密注意力模式,确保输出精度。