谷歌推出Gemini智能体,挑战OpenAI GPT-5.2并开源DeepSearchQA基准

AI资讯2个月前发布 ainav
42 0

12月12日讯,在OpenAI推出GPT-5.2之后,谷歌紧随其后发布了更为强大的Gemini Deep Research深度研究智能体,并首次面向开发者开放了全新的交互API(Interactions API)。

此外,谷歌还开源了DeepSearchQA这一全新基准测试,用于评估多步骤复杂检索任务中的研究全面性。此番升级标志着AI的自主研究能力正式迈入工业化应用的新阶段。

谷歌推出Gemini智能体,挑战OpenAI GPT-5.2并开源DeepSearchQA基准

Gemini Deep Research基于 Gemini 3 Pro构建,专为长周期的内容收集与综合任务进行了优化。相比前代,幻觉率降低了40%,成为谷歌有史以来“最具事实性”的模型。通过专项训练,该智能体在复杂任务中的报告质量得到了显著提升。

据Google DeepMind产品经理路卡斯·哈斯(Lukas Haas)在社交平台X上透露,Gemini Deep Research已达到当前最优性能水平(SOTA)。在谷歌内部基准测试中,其得分高达46.4%,并且在 BrowseComp 上的表现可与GPT-5 Pro相媲美。但相较之下,Gemini Deep Research的价格却只有其十分之一。

该智能体通过反复规划研究路径来实现深入分析,包括生成搜索查询、阅读结果、识别信息缺口并再次优化搜索等步骤。此次升级显著提升了网页搜索能力,使其能够更精准地从网站中提取具体数据。

谷歌推出Gemini智能体,挑战OpenAI GPT-5.2并开源DeepSearchQA基准

据称,该智能体在 Humanity’s Last Exam (HLE)、DeepSearchQA 以及 BrowseComp 等多个评测中均取得了最新最优成绩。并且能够在显著降低使用成本的情况下生成深入研究报告。未来,这项技术将被整合到 Google Search、NotebookLM、Google Finance 和 Gemini App 中。

全新基准测试:DeepSearchQA

为应对真实世界中复杂的多步骤研究需求,谷歌同时发布了DeepSearchQA数据集与工具。该评测基准涵盖17个不同领域,包含900个“因果链”任务。每个任务都需要智能体基于前序分析结果生成详尽答案,以此来衡量其研究精度与检索全面性。

谷歌表示,DeepSearchQA还可以用来评估“思考时间”对智能体性能的提升作用。内部测试显示,增加搜索与推理步骤能够显著改善表现。这一发现将在未来版本中得到进一步探索和优化。

谷歌推出Gemini智能体,挑战OpenAI GPT-5.2并开源DeepSearchQA基准

开发者可通过访问官方提供的数据集、排行榜以及Colab示例,并参考技术报告详细了解DeepSearchQA的实现细节。

实际应用场景

目前,Gemini Deep Research已在多个需要高精度和上下文理解的行业中展现出显著优势。特别是在金融服务、生物技术和市场研究等领域表现尤为突出。

  • 在金融领域,企业正在利用Deep Research自动化尽职调查中的信息收集环节,例如整合市场信号、分析竞争格局以及评估合规风险。这显著提升了研究效率。

  • 在科研领域,Axiom Bio公司使用该智能体处理药物毒性预测相关的文献分析,获得了更高的研究深度与颗粒度,从而加速了新药开发流程。

开发者工具:强大的功能支持

通过Interactions API,开发者可以调用Gemini Deep Research构建下一代自动化研究工具。主要功能包括:

  • 统一信息整合:支持上传PDF、CSV等文件格式,并能有效处理大上下文量的数据。

  • 可控报告结构:允许通过提示词定义输出结构、标题以及表格格式等内容。

  • 精细引用管理:为报告中的每个事实提供细粒度的来源标注。

  • 结构化数据输出:支持JSON schema,便于后续系统处理和分析。

使用Interactions API

开发者可以通过Google AI Studio获取Gemini API Key,并开始使用Interactions API进行应用开发。

谷歌推出Gemini智能体,挑战OpenAI GPT-5.2并开源DeepSearchQA基准

谷歌表示,未来版本将增加原生图表输出功能,并扩展Model Context Protocol(MCP)支持以接入更多自定义数据源。同时,Gemini Deep Research也将整合到企业级服务平台Vertex AI上。

参考资料:

  • https://blog.google/technology/developers/deep-research-agent-gemini-api/

  • https://blog.google/technology/developers/interactions-api/

© 版权声明

相关文章