商汤科技推出具身智能平台

AI工具11小时前发布 ainav
3 0

什么是”悟能”

“悟能”是商汤科技最新推出的面向机器人与智能设备的具身智能平台。该平台基于商汤领先的”开悟”世界模型,结合多模态大语言模型技术,为机器人提供强大的感知、决策和行动能力。系统架构分为三层:感知层(整合视觉、语音、触觉等多种传感器输入)、决策层(通过LLM与世界模型协同进行规划)以及行动层(实现机械臂和移动底盘的端到端控制)。该平台可深度赋能各类终端硬件,支持多种场景应用,能够生成多视角视频,构建高精度4D环境模型,从而实现复杂任务的自主执行。

商汤科技推出具身智能平台

“悟能”的核心功能

  • 多模态感知融合
    • 通过整合视觉、语音和触觉等多种传感器数据,实现对周围环境的全方位感知与深度理解。
    • 实时精确识别物体、人物及空间布局信息,为后续决策提供可靠的环境数据支持。
  • 智能决策系统
    • 创新性地将大语言模型(LLM)与世界模型相结合,实现对语言指令和物理世界的深度融合理解。
    • 具备强大的任务规划能力,可根据具体目标自动生成最优执行方案,确保任务高效完成。
  • 精准行动控制
    • 采用端到端的控制技术,实现机械臂和移动底盘的精确动作执行。
    • 在实际操作过程中实时调整策略,确保动作执行的灵活性与可靠性。
  • 场景适配能力
    • 支持多种硬件设备的无缝接入,可嵌入各类端侧芯片。
    • 适应不同应用场景需求,提供灵活部署方案。

总结:

“悟能”平台凭借其独特的多模态感知、智能决策和精准控制能力,正在重新定义机器人与智能设备的应用边界。其强大的环境建模能力和跨场景适配性,为各行业智能化转型提供了强有力的技术支撑。

© 版权声明

相关文章