AI 在学术研究领域的突破又上了一个新台阶。
最近,一个名为 Virtuous Machines 的 AI 系统完成了一项令人惊叹的任务:它仅用 17 小时、投入 114 美元,成功招募了 288 名真人志愿者,独立完成了从实验设计到论文撰写的全过程,并最终产出了一份长达30页的学术论文。

更令人惊讶的是,这个系统实现了科研全流程的自动化操作。
让我们深入了解这项创新性研究。
AI驱动的科研革命:从灵感萌发到论文发表
模拟人类科研流程的AI系统
这篇由AI独立完成的论文聚焦于认知心理学领域,具体研究方向为人类视觉认知机制。
与传统AI不同,这个系统采用了与人类科研人员相似的工作方法。

研究过程中,系统首先基于认知心理学的理论框架提出关键问题,例如:
- 视觉工作记忆与心理旋转能力之间存在何种关联?
- 心理意象的清晰度如何影响视觉认知任务的表现?
(注:视觉工作记忆指人类维持和处理视觉信息的能力,涉及信息存储、操作和提取过程;而心理旋转则是一种通过心理操作实现空间物体旋转以完成感知匹配的认知机制)

在实验设计阶段,系统不仅考虑了样本量的科学计算和变量控制,还采用了VVIQ2量表来评估被试的心理意象清晰度。
随后,通过Prolific平台招募了288名受试者,并最终获得277份有效数据(部分未完成实验的被试数据被系统自动筛选排除)。
智能协作与高效执行:AI系统的内部机制
要实现如此复杂的科研任务,AI系统采用了独特的架构设计。
其核心是协作式模拟人类认知机制的技术框架,结合动态知识交互技术。
在协同工作模式下,系统的控制中枢”Master”负责整体协调,而其他功能模块则专注于特定任务:
- 文献检索与分析
- 实验设计与执行
- 数据分析与建模

系统的底层能力构建采用了多层架构,就像一个洋葱模型:

最内层是强大的知识检索能力,能够从海量学术数据库中精准提取所需信息;
中间层则是抽象与提炼能力,可以归纳总结不同研究的共通逻辑;
外层是元认知反思模块,使系统具备自我检查功能。例如,在数据分析阶段,系统会自动评估所采用的方法是否恰当,并检验假设与结论之间的逻辑一致性。
高效性能背后的短板
尽管展现出惊人的效率,但这个AI系统仍有一些局限性。
其显著优势包括:
- 相比人类团队,工作效率提升10倍以上;
- 数据分析更加严谨,能够识别并避免统计显著性的陷阱(如效应量过小的情况);
- 有效处理实验中的噪声数据。
然而,系统偶尔会出现理论理解偏差,例如:
- 将已有研究结论错误地标榜为新发现;
- 忽略图表Y轴单位标注等细节问题.
这些小缺陷表明,尽管AI在科研效率上表现出色,但在理论深度和创新思维方面,仍需进一步提升。
研究地址: https://arxiv.org/abs/2508.13421
参考链接: https://x.com/IntuitMachine/status/1972252510585847835
本文来自微信公众号:量子位(ID:QbitAI),作者:闻乐