小米发布具身大模型MiMo-Embodied,全面开源,业界首个融合自动驾驶与具身智能

AI资讯3个月前发布 ainav
68 0

11月21日,小米集团正式宣布推出全新具身大模型 MiMo-Embodied 并全面开源。

随着智能技术的快速发展,特别是在家居场景和自动驾驶领域的深度融合,行业内面临着一个关键性挑战:如何实现机器人与车辆在认知能力上的高效互通?具体而言,室内作业智能与室外驾驶智能能否形成有效协同?针对这一问题,小米公司重磅推出了 MiMo-Embodied 具身大模型。

小米发布具身大模型MiMo-Embodied,全面开源,业界首个融合自动驾驶与具身智能

作为全球首个实现自动驾驶与具身智能跨域融合的基座模型,MiMo-Embodied 成功打破了两大领域的技术壁垒。这一突破标志着通用具身智能研究正式从单一垂直领域向多场景协同应用迈进。

该模型的核心技术创新体现在三个方面:

  • 1. 跨域能力整合:同时支持具身智能的三大核心任务(可供性推理、任务规划、空间理解)以及自动驾驶领域的三大关键任务(环境感知、状态预测、驾驶规划),实现了全场景智能化覆盖。

  • 2. 双向能力协同:通过室内交互能力和道路决策能力的双向知识迁移,开创了跨场景智能融合的新模式,为智能系统在不同场景间的迁移应用提供了重要参考。

  • 3. 全链优化架构:采用”具身/自驾能力学习 → CoT 推理增强 → RL 精细强化”的多阶段训练策略,显著提升了模型在实际应用场景中的稳定性和可靠性。

在29项核心基准测试中,MiMo-Embodied 以卓越性能树立了开源基座模型的新标杆:

  • 具身智能领域:在17个评测指标上达到最佳水平,显著提升了任务规划、可供性预测和空间理解等关键能力。

  • 自动驾驶领域:在12项测试中表现出色,实现了从环境感知到驾驶决策的全链路性能突破。

  • 通用视觉语言领域:不仅强化了基础感知与理解能力,在多项关键指标上实现了显著提升,展现了强大的泛化性能。

小米发布具身大模型MiMo-Embodied,全面开源,业界首个融合自动驾驶与具身智能

目前,MiMo-Embodied 模型及其代码已正式开源,开发者可通过以下链接访问:

  • https://huggingface.co/XiaomiMiMo/MiMo-Embodied-7B

  • https://arxiv.org/abs/2511.16518

© 版权声明

相关文章