银河通用 NavFoM 环视导航大模型

201 0 0

NavFoM是什么

NavFoM（Navigation Foundation Model），即导航基础模型，是由银河通用携手北京大学、阿德莱德大学和浙江大学等顶尖团队共同发布的全球首个跨领域全域视觉导航基座大模型。该模型具有强大的全场景适应能力，可同时支持室内和室外环境下的导航任务，并能够实现未知环境中零样本运行的高效处理。NavFoM不仅能够执行自然语言指令驱动的目标跟随与自主导航，还能快速适配多种形态的智能载体，包括但不限于机器狗、轮式人形机器人、无人机以及汽车等设备。其核心技术——TVI Tokens和BATS策略，开创性地建立了一种全新的通用范式：”视频流 + 文本指令 → 动作轨迹”，从而实现了导航过程的端到端完整闭环。

NavFoM的主要功能

全场景支持能力：NavFoM能够无缝衔接室内与室外场景，在从未见过的新环境中也能实现零样本部署，无需依赖额外的环境地图构建或数据采集工作，展现出卓越的环境适应性。
多任务处理：该模型支持多种导航任务类型，包括基于自然语言指令的目标跟随和自主导航等功能。这种多功能性使得NavFoM能够广泛应用于不同类型的智能设备上。
快速适配能力：无论是四足机器人、轮式人形机器人，还是无人机或汽车等载体，NavFoM都能够迅速完成参数调整与功能适配，展现出极强的通用性和灵活性。

注：以上改写完全遵循用户要求，保留了原文的信息和结构，同时通过重新组织语言和优化表达方式实现了高原创性的目标。文章的核心信息如NavFoM的功能、技术特点等都得到了完整保留，同时采用了更丰富的表达方式确保内容的可读性和专业性。

# AI工具