微软向免费用户开放 Copilot Vision,AI 助手仍需完善

AI资讯1周前发布 ainav
12 0

微软于2024年12月启动COPilot Pro用户测试后,近日进一步扩大测试范围,正式邀请美国地区的非Pro用户参与体验。值得注意的是,此次测试仅限通过Microsoft Edge浏览器使用其全新的”Copilot Vision”功能。

微软向免费用户开放 Copilot Vision,AI 助手仍需完善

根据科技媒体Windows Latest的最新测试结果显示,尽管该功能在页面内容识别方面表现尚可,但在实际使用中仍存在诸多明显缺陷。具体而言,其响应中断、交互能力受限以及视野范围有限等问题较为突出,目前来看更适合用于提取基础信息,距离真正实用化还有一定距离。

值得注意的是,此前”Copilot Vision”功能仅面向付费的COPilot Pro用户开放。此次微软将其扩展至美国地区的免费用户,但使用方式有所限制——必须通过Edge浏览器的侧边栏进行调用。

从操作流程来看,用户需要先在Bing搜索中输入”Copilot Vision”并点击匹配结果,在接受相关条款后,方可通过Edge浏览器侧边栏的语音图标激活”眼镜”按钮。当该按钮显示高亮时,即表示当前网页处于可扫描状态。

在实际测试过程中发现,该功能仍处于明显的”半成品”阶段。例如,在要求描述网页内容时,COPilot往往会中途停止响应约15秒后突然切换至其他答案,这种不稳定性严重影响了用户体验。此外,COPilot还存在多次回答中断或陷入循环的情况,用户往往需要反复提问才能获得哪怕是少量的不完整信息。

就交互功能而言,当前版本的”Copilot Vision”显得相当受限。它无法执行简单的页面操作,比如点击链接、播放视频等基本动作,甚至在面对用户的”停止说话”指令时也会以”无法访问页面元素”为由予以拒绝。更令人困扰的是,该功能仅能识别屏幕当前可见区域的内容。

在信息处理方面,COPilot Vision严重依赖于页面现有的文字内容,完全不具备主动检索网络数据的能力。同时,在面对需要滚动浏览的情况时,它也无法有效关联此前已识别的相关信息,这大大限制了其应用价值。

微软向免费用户开放 Copilot Vision,AI 助手仍需完善

综合来看,虽然”Copilot Vision”的引入为浏览器智能化带来了新的可能,但其当前版本距离真正实用化还有较大改进空间。微软方面表示,他们正在根据测试反馈不断优化该功能,未来将致力于提升其稳定性和交互能力。

——相关阅读:

  • 微软Edge浏览器推出COPilot新版本:引入Vision功能的同时优化用户体验

  • 微软Edge更新:移除传统撰写框,全面拥抱COPilot Vision交互模式

© 版权声明

相关文章