谷歌发布的新款多模式人工智能语音助手 —— Gemini Live

AI工具2个月前发布 ainav
76 0

Gemini Live指的是什么?

Google推出的Gemini Live是一款具备自然语言处理及多模态感知技术的智能语音助手,它能够支持与用户的图像、视频以及语音互动交流。用户可以利用语音命令来操控该应用,实现日常任务的自动化执行。此产品提供了多达10种声音选项,并已融入了谷歌的各种原生应用程序中。展望未来,Gemini Live计划将其服务范围拓展至iOS平台并增加更多语言的支持,以期为用户提供更为自然和智能的互动体验。

Gemini Live

Gemini实时版的核心特性

  • 人机交流中的文字沟通形式用户能够以流畅的自然语言与Gemini Live互动,体验如同人际对话般的沟通。
  • 多种感知方式辨识具备解析与操作音频、图片及影片的能力,带来多样化的互动感受。
  • 定制声音:具备多样的声音选择,让用户能够根据自己的偏好来挑选。
  • 工作流程的自动执行协助用户自动化处理日常生活中的任务,包括电子邮件管理和计划安排等事宜。
  • 智能化的中断与继续功能用户可随时中断交流以提问新的问题,而Gemini Live则能即时调整并延续对话。
  • 应用程序整合通过与谷歌原生应用程序的深度融合,提升用户的操作效率。

掌握Gemini实时应用的方法

  • 启动助理要启动Gemini Live,用户可以长时间按下谷歌Pixel或纯净安卓系统的电源按钮,或是通过说出语音指令“嘿,Google”。
  • 日常交谈通过与Gemini Live交流,您可以提问或寻求援助,实现流畅的自然语言互动。
  • 定制化配置在初次使用时,用户能够挑选出最符合个人偏好的语音样式与音调,共有十种各异的声音选项可供挑选。
  • 工作流程自动执行向Gemini Live指示需自动化处理的事项,比如设定提醒、发出电子邮件或是规划行程。
  • 使用应用程序允许Gemini Live接入用户的电子邮件、定位服务及联系人列表等功能,能够更加高效地辅助用户处理日常生活中的各项事务。
  • 创建文本:要求Gemini Live创作图像或其它材料,比如为某个特别事件设计图片。
  • 组合应用Gemini Live 与包括电子邮件、云端存储和照片管理在内的谷歌各类应用程序深度融合,支持在不同软件间无缝执行任务。
  • 维持互动在与Gemini Live交流时,用户能够随时插话或给出新指示和提问,而它则会即时调整自身以维持连贯的交谈。

Gemini-Live

适用于 Gemini Live 的用户群体

  • 企业职场人士适用于需高效处理日程安排、电子邮件及会议的职场人员。
  • 科技探路者感兴趣于人工智能及最新技术创新的用户。
  • 使用多种语言的用户具备多种语言的支持功能,适应来自世界各地、拥有不同语言背景的使用者。
  • 创新人才寻求迅速创作新颖设计及视觉元素的创意工作者与艺术创作者。
  • 长辈们期望通过语音交流来简化技术操作的老年人。
© 版权声明

相关文章