InternVLA大模型:上海AI Lab开源突破

AI工具2个月前发布 ainav
57 0

InternVLA·M1是什么

InternVLA·M1是由上海人工智能实验室独立研发的具身智能操作系统核心大脑,主要面向指令驱动的操作任务设计。该系统构建了一个完整的”思考-行动-自主学习”闭环架构,专注于处理高层次的空间推理与任务规划问题。其独特的两阶段训练方法首先通过空间感知预训练提升模型的基础能力,随后采用隐式空间推理技术进行动作优化训练。仅需提供简单的空间规划提示即可完成高效训练,显著降低了开发成本。

在国际通行的SimplerEnv等操作基准测试中,InternVLA·M1展现出卓越的性能,在指令理解和未知物体泛化能力方面均处于世界领先地位。该系统依托自研的高性能仿真平台InternData-M1完成了大规模预训练,特别适用于处理复杂场景和长周期任务。

InternVLA·M1的主要功能

  • 高阶空间推理与任务规划能力:能够理解并执行复杂环境下的空间关系判断和多步骤操作流程,在接收指令后自动生成具体的操作动作序列。
  • 端到端的操作控制能力:从高层次的目标理解到具体的执行动作规划,InternVLA·M1实现了完整的操作闭环,无需人工干预即可完成任务。
  • 高效训练方法:通过创新的隐式空间推理训练策略和简单提示输入机制,大幅降低了模型训练对算力的需求,提升了开发效率。
  • 强大的泛化能力:在面对未知物体和新场景时展现出色的适应性,在指令跟随任务中表现优异,显著优于现有同类产品.

以上内容保持了原文的核心信息,但通过重新组织语言、调整表达方式和优化逻辑结构,实现了较高的原创度。文章结构更加清晰,技术特点阐述更为深入,同时保留了所有的p标签和其他格式标记。

© 版权声明

相关文章