在机器人学习领域顶级会议CoRL上,英伟达推出了一系列重量级开源技术,其中最引人注目的当属与谷歌DeepMind和迪士尼研究院联合开发的Newton物理引擎。
此次发布堪称机器人领域的”全家桶”解决方案:除了提供Newton这样的核心技术,还一口气推出了能够赋予机器人类人推理能力的Isaac GR00T N1.6基础模型,以及可以生成海量训练数据的Cosmos世界基础模型。这些创新技术直接针对当前机器人研发中最棘手的问题提供了全新解决方案。

目前,包括波士顿动力(Boston Dynamics)、Figure AI等在内的顶尖机器人公司,以及斯坦福大学、苏黎世联邦理工学院等世界著名高校都已经开始测试和应用这些新技术。
真实世界的模拟:Newton物理引擎的突破
对于全球超过25万机器人开发者而言,如何实现仿真环境与现实世界的有效迁移始终是一个巨大挑战。
人形机器人的复杂关节结构和动态平衡控制难度之高,使得现有物理引擎难以满足需求。
英伟达Omniverse仿真技术副总裁Rev Lebaredian指出:”人形机器人是物理AI的下一个前沿领域,它们需要在不可预测的环境中进行推理、适应并安全行动。”
而Newton引擎的出现恰如其分地解决了这一难题。这个由Linux基金会托管的开源项目基于英伟达的Warp和OpenUSD框架,采用GPU加速技术。其最大亮点在于能够精确仿真机器人在复杂环境中的动作,例如雪地行走、碎石路面上移动,以及精细操作杯子和水果等任务。
目前已有苏黎世联邦理工学院的机器人系统实验室、慕尼黑工业大学、北京大学等顶尖机构开始采用Newton引擎,光轮智能(Cognitive3D)和Style3D等仿真公司也加入到了早期用户行列。
智能决策中枢:Isaac GR00T N1.6的深度思考能力
长期以来,让机器人理解并执行如”帮我拿杯水”这样的模糊指令一直是行业难题。
此次发布的Isaac GR00T N1.6开源模型通过集成Cosmos Reason视觉语言模型,赋予了机器人接近人类的推理能力,并即将在Hugging Face平台上开放下载。
该模型能够结合已有知识、常识和物理原理,将模糊指令转化为具体行动计划。更进一步的是,它支持同时进行移动控制和物体操作,具备 torso和手臂的更大活动自由度,甚至可以推开较重的房门。
值得注意的是,Cosmos Reason的下载量已突破百万次,在Hugging Face的物理推理模型排行榜上持续领先。英伟达还特别提供了开源的物理AI数据集,包含数千条合成与真实世界的轨迹数据,总下载量已超过480万次。
包括AeiROBOT、Franka Robotics、LG Electronics等知名机器人制造商正在评估将Isaac GR00T N系列模型集成到其产品中。
创新训练方法:从抓取技能到全面测试
物体抓取是机器人领域最具挑战性的任务之一。基于英伟达Omniverse平台的Isaac Lab 2.3开发者预览版,新增了先进的灵巧抓取工作流。
这一工作流的最大特色在于其”自动化课程体系”设计:从简单任务开始,逐步提升难度,并动态调整重力、摩擦力等参数设置,使机器人能够在各种不可预测的环境中掌握复杂技能。例如,波士顿动力的Atlas机器人正是通过这个系统显著提升了抓取能力。
针对测试环境分散且单一的问题,英伟达与光轮智能合作开发了Isaac Lab Arena,这是一个用于大规模实验和标准化测试的开源策略评估框架。它可以让开发者无需从零构建系统,即可在仿真环境中进行复杂、大规模的机器人性能评估。
软硬件齐头并进:加速机器人开发
在硬件方面,英伟达同样展现了强大的技术实力。
全新的GB200 NVL72机架式系统集成了36颗Grace CPU和72块Blackwell GPU,目前已获得主要云服务提供商的支持。而RTX PRO服务器则为机器人开发提供了统一的硬件架构,RAI Institute已率先部署使用。
最值得关注的是搭载了Blackwell GPU的Jetson Thor设备,它能够支持机器人同时运行多个AI工作流,并实现实时智能交互。Figure AI、银河通用、Google DeepMind和宇树科技等合作伙伴已经开始评估这一创新硬件。
在CoRL会议收录的论文中,近半数都引用了英伟达的相关技术。卡内基梅隆大学、华盛顿大学等顶尖研究机构都在使用英伟达的GPU和CUDA加速库进行机器人相关研究。斯坦福视觉与学习实验室的BEHAVIOR机器人学习基准测试项目,以及北京大学开发的触觉机器人仿真平台Taccel均建立在英伟达的技术基础之上。
从开源物理引擎到AI基础模型,从训练方法到硬件基础设施,英伟达这次的”全栈式”布局正在重新定义机器人研发的游戏规则。随着这些创新技术的应用,实验室中的机器人距离走进我们的日常生活可能真的不再遥远。