新研究揭示AI无法识别模拟时钟与日期时间

AI资讯2周前发布 ainav
17 0

近日有外媒报道显示,在某些基础生活场景中,人工智能的表现令人担忧。尽管AI在编程、图像生成和文本创作等方面展现出色能力,但在简单的时间判断任务上却频频出错。例如,它难以准确识别时钟指针的位置,也无法正确推算日期对应的星期几。

这一发现出自2025年”国际学习表征会议”(ICLR),相关论文已在arXiv平台发布,目前处于同行评审阶段。研究结果揭示了AI在时间感知方面的显著缺陷。

该研究的主要作者、爱丁堡大学研究员罗希特·萨克塞纳指出:”人类从小就习得时间与日历概念,而AI的这些能力缺失令人警醒。”这种基础能力的欠缺将严重影响AI在排班调度、自动化流程控制和辅助技术等应用场景中的可靠性。

新研究揭示AI无法识别模拟时钟与日期时间

测试中,研究团队向包括Meta的Llama 3.2-Vision、Anthropic的Claude-3.5 Sonnet、谷歌的Gemini 2.0和OpenAI的GPT-4等主流视觉大模型输入了专门设计的时钟与日历图像。结果显示,所有模型在时间判断任务上的准确率均未超过50%。

萨克塞纳解释说:”传统AI训练主要依赖大量标注样本,而读取时钟需要复杂的空间推理能力。模型不仅要识别指针位置关系,还要处理各种表盘设计(如罗马数字或艺术化风格),这些都远超简单的图像识别范畴。”

在日历问题测试中,AI的表现更加糟糕。例如,在”每年第153天是星期几”这样的基础问题上,模型的错误率仍然很高。数据显示,AI判断时钟的准确率为38.7%,日历判断准确率仅为26.3%。

萨克塞纳指出:”传统计算机擅长算术运算,但大语言模型并不真正进行逻辑推理。它们只是基于训练数据中的模式预测结果,在处理罕见或不常见任务时表现尤其糟糕。”

研究建议,未来AI系统需要在以下几个方面改进:一是加强基础生活场景的专项训练;二是优化时间推理算法;三是建立更完善的时间感知模型。只有这样,才能使AI真正胜任日常生活中的各种应用场景。

© 版权声明

相关文章