智谱AI研发的模拟人手操控手机的AI智能体——AutoGLM

AI工具3个月前发布 ainav
138 0

AutoGLM代表的是一个自动化处理大规模语言模型的系统。

AutoGLM是由智谱AI团队最新研发的一款基于图形用户界面(GUI)的“Phone Use”智能体程序。它能够模仿人类在手机上的操作行为,独立执行包括社交媒体互动、在线购物和酒店预订在内的多种任务。通过接收用户的文字或语音命令,AutoGLM可以自动处理复杂的操作步骤,极大地减少了用户手动干预的需求。

AutoGLM的关键技术涵盖基础代理的解耦设计、中介接口以及自适应在线课程强化学习架构,这些使得AutoGLM能够精准执行操作并具备灵活的任务规划能力,从而解决了传统大型模型在动作精确度和任务灵活性方面的难题。当前,AutoGLM正在内部测试中,并初步向部分清言用户开放(现阶段仅限安卓系统)。

AutoGLM

AutoGLM的核心特性

  • 模仿人使用手机的行为能够响应文本或口语命令,完成诸如为微信上的帖子点赞和留言、在淘宝上购买商品、通过携程预定住宿、使用12306平台购票以及利用美团订购外卖等操作。
  • 即时操作能够即时接收并处理命令,在手机上运行复杂的任务流程。
  • 不需要通过API调用无需借助特定的API接口,可以直接操作图形用户界面(GUI)。
  • 自动运行任务流程在实际环境里运行自动化的任务,以简化用户的操作步骤。

AutoGLM的核心技术机制

  • 基本智能实体的分离交互层通过运用自然语言指示来分离任务规划和行动实施,增强智能系统的操作技能及灵活度。
  • 提升在线课程的增强学习架构在实际的网络环境中提升智能体的功能,并通过采用动态的学习方法持续优化自身性能。
  • 任务安排和行动实施的区分通过采用中介界面的设计方案,实现任务策划与操作实施的分离优化,从而增强操作实施的精准性。
  • 根据进展灵活变更学习挑战的级别依据智能体现有的能力等级,灵活变更学习任务的复杂度,以充分发挥模型的最大潜力。
  • 策略调整与历史经验重用通过运用KL散度来调控策略的调整及智能体信心的经验重播,可以缓解模型在反复训练过程中出现的记忆消退现象。

AutoGLM的官方仓库链接

  • 官方网站PROJECThttps://github.com/xiao9905/AutoGLM
  • 参加AutoGLM安卓内部测试的报名链接如下:访问这个链接以获取更多信息:https://agent.aminer.cn/

AutoGLM的使用情境

  • 社交平台运营筦理在社交媒体上自动化完成点赞、留言和转发等功能。
  • 网上购货在电子商务平台中查找产品信息、对比售价、完成订单交易及追踪配送情况等操作。
  • 出行安排在旅行服务平台上查找和预定住宿、飞机票及火车票等相关服务。
  • 点餐外送在外卖网站上查看菜品列表、提交订单、完成付款及监控配送进度。
  • 日常生活中的信息检索例如查找天气更新、浏览新闻报道或查看股市行情等。
© 版权声明

相关文章