新研究揭示AI无法识别模拟时钟与日期时间

AI资讯1年前 (2025)发布 ainav

396 0 0

近日有外媒报道显示，在某些基础生活场景中，人工智能的表现令人担忧。尽管AI在编程、图像生成和文本创作等方面展现出色能力，但在简单的时间判断任务上却频频出错。例如，它难以准确识别时钟指针的位置，也无法正确推算日期对应的星期几。

这一发现出自2025年”国际学习表征会议”（ICLR），相关论文已在arXiv平台发布，目前处于同行评审阶段。研究结果揭示了AI在时间感知方面的显著缺陷。

该研究的主要作者、爱丁堡大学研究员罗希特·萨克塞纳指出：”人类从小就习得时间与日历概念，而AI的这些能力缺失令人警醒。”这种基础能力的欠缺将严重影响AI在排班调度、自动化流程控制和辅助技术等应用场景中的可靠性。

测试中，研究团队向包括Meta的Llama 3.2-Vision、Anthropic的Claude-3.5 Sonnet、谷歌的Gemini 2.0和OpenAI的GPT-4等主流视觉大模型输入了专门设计的时钟与日历图像。结果显示，所有模型在时间判断任务上的准确率均未超过50%。

萨克塞纳解释说：”传统AI训练主要依赖大量标注样本，而读取时钟需要复杂的空间推理能力。模型不仅要识别指针位置关系，还要处理各种表盘设计（如罗马数字或艺术化风格），这些都远超简单的图像识别范畴。”

在日历问题测试中，AI的表现更加糟糕。例如，在”每年第153天是星期几”这样的基础问题上，模型的错误率仍然很高。数据显示，AI判断时钟的准确率为38.7%，日历判断准确率仅为26.3%。

萨克塞纳指出：”传统计算机擅长算术运算，但大语言模型并不真正进行逻辑推理。它们只是基于训练数据中的模式预测结果，在处理罕见或不常见任务时表现尤其糟糕。”

研究建议，未来AI系统需要在以下几个方面改进：一是加强基础生活场景的专项训练；二是优化时间推理算法；三是建立更完善的时间感知模型。只有这样，才能使AI真正胜任日常生活中的各种应用场景。

文章版权归作者所有，未经允许请勿转载。

ainav

238 0

ainav

278 0

ainav

207 0

ainav

104 0

ainav

204 0

ainav

207 0