近日有消息称,谷歌已悄然推出一项引人注目的人工智能增强功能,该功能可通过智能手机摄像头实时获取屏幕画面并进行分析解读。据知情人士透露,这一名为Gemini Live的功能已经进入实际应用阶段,用户可以通过手机摄像头捕捉周围环境的画面内容,系统将基于这些视觉信息提供实时反馈和相关建议。
值得注意的是,这一功能的推出距其首次亮相已有近一年时间。在去年5月的Google I/O开发者大会上,谷歌就曾展示了名为Project Astra的新项目,该技术能够在Pixel手机上本地运行,并通过Gemini AI模型实现视觉识别和理解。
据官方介绍,Project Astra是谷歌最新推出的多模态人工智能项目。与传统AI不同,这一系统能够直接从摄像头获取实时画面信息并进行解析,帮助用户更好地理解和处理周围环境中的视觉内容。这种创新性的技术应用被认为是谷歌在多模态AI领域的一次重要突破,并且被外界视为对OpenAI GPT-4等同类技术的有力竞争。
© 版权声明
文章版权归作者所有,未经允许请勿转载。