6月5日讯,近日,人工智能开发平台Hugging Face推出了一款名为SmolVLA的开源机器人AI模型。据官方介绍,尽管规模较小,但该模型在虚拟与现实环境中的表现均超越了诸多大型机器人模型。
Hugging Face在其官方博文中指出,SmolVLA旨在推动视觉-语言-行动(VLA)模型的应用,并加速通用型机器人智能体的研究进程。该模型不仅具备轻量化和高性能的特点,更提供了一套全新的方法论,用于训练与评估通用机器人技术。
作为Hugging Face在低成本机器人软硬件领域迅速扩展的最新成果,SmolVLA延续了该公司在机器人领域的布局。去年,Hugging Face推出了专注于机器人领域的LeRobot系列模型、数据集及工具。近期,公司还收购了法国初创企业Pollen Robotics,并推出了一系列价格亲民的机器人系统,包括人形机器人。
SmolVLA模型包含4.5亿个参数(即权重,决定模型行为的关键组件),其训练基于Hugging Face平台上的LeRobot社区提供的专有机器人数据集。Hugging Face强调,该模型体积小巧,可在单块消费级GPU甚至MacBook上运行,并且能在包括公司自家机器人系统在内的经济型硬件上完成测试与部署。
值得注意的是,SmolVLA还支持”异步推理堆栈”功能。Hugging Face表示,这一设计使模型能够将机器人动作处理与其他感知任务(如视觉、听觉)分离,从而让机器人在动态环境中做出更快响应。
目前,SmolVLA已正式对外开放下载。已有用户在社交平台X上分享称,他们已成功利用该模型实现了对第三方机械臂的控制。
在开源机器人领域,Hugging Face并非唯一参与者。英伟达推出了自己的开放机器人工具集,初创企业K-Scale Labs也在该领域持续发力。此外,像Pal Robotics、Boston Dynamics等知名机器人公司也正在探索相关技术路径。