分析师的暮光?OpenAI发布AI代理“深入分析”

AI资讯1个月前发布 ainav
50 0

OpenAI发布了名为“深度探索”的人工智能代理程序,这是否意味着分析师们即将失去工作?

在当地时间2月2日的在线直播活动中,OpenAI发布了名为“深度探索”(Deep Explore)的新人工智能助手,该工具专为协助用户通过ChatGPT开展更深层次和更为复杂的调研工作而设计。

分析师的黄昏?OpenAI推出AI Agent“深度研究”

OpenAI指出,此功能特别针对那些“在金融、科学、政策及工程等行业从事复杂知识工作的人士”,旨在提供详尽准确且可靠的研究辅助。此外,对于涉及重大采购决定的细致调研,如选购车辆、家用电器或家具时,该功能同样适用。

简而言之,ChatGPT的“深度探索”特性专为那些不仅仅满足于迅速获得答复或是概要的人设计,它致力于整合多渠道的信息资源,并持续进行详尽分析直至寻得最为恰当的答案。

分析师的黄昏?OpenAI推出AI Agent“深度研究”

Altman在文中表示:

该工具能够访问网络资源,执行复杂的调研与分析,并最终生成详细的报告。它的优势在于能高效地完成原本可能耗时多日并需支付高额费用的工作任务。

它的运算需求高并且处理速度较慢,但它作为首个能够承担广泛而复杂的有价值的作业的人工智能系统而存在。

分析师的黄昏?OpenAI推出AI Agent“深度研究”

对于这一点,网友们表现出了极大的兴趣,一些人表示“已准备就绪即将体验”,还有一些网友主动提供自己的账户信息,希望可以优先尝试ChatGPT的“深入分析”特性。

分析师的黄昏?OpenAI推出AI Agent“深度研究”分析师的黄昏?OpenAI推出AI Agent“深度研究”

有些人质疑,ChatGPT的深入分析工具是否优于谷歌的相关功能?是否存在泄露个人信息的风险呢?是否能够实现将报告内所有句子的首个字母转换为大写字母的功能?

分析师的黄昏?OpenAI推出AI Agent“深度研究”分析师的黄昏?OpenAI推出AI Agent“深度研究”分析师的黄昏?OpenAI推出AI Agent“深度研究”分析师的黄昏?OpenAI推出AI Agent“深度研究”

目前为定向发布,日后将会扩大覆盖范围至更广泛的用户群体。

Altman指出,“深度研究”功能现仅限于ChatGPT Pro的订阅者使用,每位用户每月可进行100次查询。该功能随后会逐步向Plus和Team层级的用户开放,并最终覆盖企业级(Enterprise)客户。预计在大约一个月的时间内,Plus版本将会上线,同时付费用户的查询限额将会“大幅提升”。

分析师的黄昏?OpenAI推出AI Agent“深度研究”

对于这一情况,不少网民认为每月200美元的ChatGPT Pro订阅价格过高:

关心的并不是那些非免费的东西。

分析师的黄昏?OpenAI推出AI Agent“深度研究”

有网民推测,未来若实现通用人工智能(AGI),是否会采取每月收费2000美元,并限制使用次数为十次的模式?

分析师的黄昏?OpenAI推出AI Agent“深度研究”

实际上,Altman指出,尽管免费用户可以访问该服务,但他们获得的配额极为有限。

分析师的黄昏?OpenAI推出AI Agent“深度研究”

值得留意的是,当前“深入分析”功能只在部分地区提供服务,而OpenAI还未透露这项功能将在何时对英国、瑞士以及欧洲经济区(EEA)的用户解锁。

当前,ChatGPT的研究成果仅以文本形式呈现。然而,OpenAI有意向在将来引入嵌入图像、数据分析可视化等更为“分析性”的输出方式。另外,该公司还透露计划支持接入更加多样化的数据源,“订阅式”数据库及企业内部资料都在考虑之列。

分析师的黄昏?OpenAI推出AI Agent“深度研究”

AI的准确度表现怎样?依然存在一定的限制。

分析师是否会大规模失去工作呢?核心问题是ChatGPT的“深入分析”能力是否能达到专业的研究标准?尽管如此,人工智能仍有其局限性,“幻觉”现象——产生不准确或误导性内容的风险依然存在。

基于这一考量,OpenAI宣布将确保每项深入研究的结果都做到“详尽纪录,并提供明确的信息源链接与推理概要”,以便于用户的查阅与核实。

尽管如此,评估这一措施能否有效防止用户被AI误导还为时过早——值得注意的是,OpenAI之前在其产品ChatGPT中加入的AI搜索引擎也曾因提供不准确的答案而受到批评。TechCrunch的测试表明,在一些查询上,ChatGPT Search的表现甚至不及谷歌搜索稳定可靠。

分析师的黄昏?OpenAI推出AI Agent“深度研究”

提升准确性:采用特别调优的o3版人工智能系统

为提升深入分析的精确度,OpenAI利用了一个特别设计的o3“推断”人工智能系统。此系统通过增强性学习技术进行了调优,并且专注于处理那些需借助网络浏览器及Python软件包来解决的真实场景任务。

OpenAI指出,这款o3模型的新版经过了专门调校以适应“网络导航与数据解析的需求”。它具备运用逻辑推演来搜集、剖析并研究网上庞大数量的文字资料、图像和PDF文件的能力,并且能够依据最新获得的数据动态地调整其策略方案。

此模型同样能够查看用户提交的文档,创建和优化图形展示,将其生成的图像与网络图融入到回复中,并在回应里引述资料里的特定语句或片段。

为了检验这一模型的表现,OpenAI实施了一项名为“人类终极考试”的评价手段。这项评测包含了超过3000个复杂度极高的学术题目,远远超越了其他的AI测评标准,旨在保证评估的挑战性能够持续跟上模型发展的步伐。

使用o3模型的ChatGPT“深入分析”特性,在评估过程中的正确率达到了26.6%,尽管这个比例看起来并不突出,但它实际上显著超越了其它人工智能系统的测试表现。

谷歌Gemini思维:6.2%

xAI Grok-2:占比为3.8%

GPT-4o由OpenAI开发,准确率为3.3%。

虽然如此,OpenAI依然指出ChatGPT的“深入分析”功能有其限制,可能产生不准确的推理和混淆可靠资讯与虚假信息的问题,并在处理不确定因素时难以清晰表达。

© 版权声明

相关文章