面壁智能发布”前进四” MiniCPM 4.0:强劲性能

AI资讯2个月前发布 ainav
30 0

6月7日讯,面壁智能于6月6日晚正式发布端侧大模型MiniCPM 4.0版本。据官方介绍,该模型通过采用自研的CPM.cu推理框架,在性能上实现了显著突破。

面壁智能发布

此次发布的MiniCPM 4.0系列包含两个版本:一个是8B的”闪电稀疏版”,另一个是0.5B的”轻巧灵动版”。其中,8B版本采用了创新性的稀疏架构设计,而0.5B版本则以其高效性能被称为”最强小小钢炮”。

针对传统模型在长文本和短文本处理上难以兼顾的技术难题,MiniCPM 4.0-8B引入了独特的”高效双频换挡“机制。这一创新技术能够根据具体任务的特征自动切换注意力模式:在面对需要深度思考的长文本处理时,系统会自动启用稀疏注意力机制以降低计算复杂度;而对于短文本场景,则无缝切换至稠密注意力模式,确保结果的精准度。

面壁智能发布

面壁智能发布

据官方表示,MiniCPM 4.0目前已成功适配vLLM、SGLang、LlamaFactory等多个主流开源框架。其核心优势在于内置的自研CPM.cu端侧推理框架,通过在投机采样、模型压缩量化以及端侧部署等关键环节的技术创新,实现了高达90%的性能优化和速度提升。官方宣称,这一突破将推动端侧推理技术实现从”理论探索”到”实际应用”的全面跨越。

© 版权声明

相关文章