一位退休的经济学教授用一个简单的井字棋问题,揭示了GPT-5令人失望的表现,这与奥尔特曼博士所描述的“博士级AI”形象形成了鲜明对比。
这个问题涉及到所有人都熟悉的井字棋游戏。教授要求将棋盘向右旋转90度一次。
从常理来看,旋转棋盘并不会改变游戏的本质,因为这只是一个简单的图形变换。然而,GPT-5却给出了令人困惑的回答:
虽然棋盘的方向改变了,但对策略的影响微乎其微。不过,从心理层面来看,玩家可能会感受到一些不同。
接着,GPT-5的回答更是让人啼笑皆非。当教授询问旋转棋盘是否会让人类更难玩好这个游戏时,GPT-5回答道:
从策略上看,旋转不会改变任何事情。但对人类而言,情况就不同了。
这段话虽然在理论上是正确的,但在实际应用中却显得毫无意义。更糟糕的是,GPT-5随后提出要“绘制带有位置标记的旋转井字棋棋盘”,结果生成的图表不仅混乱,还存在多处错误和空白区域。
专家视角下的问题
这位教授名叫Gary Smith,是波莫纳学院的一名退休经济学教授。他在测试GPT-5时发现,模型在井字棋策略上的回答与博弈论的基本原理相悖。
根据常识,先手在角落落子的胜算更高,但GPT-5却坚持认为选择中心更优,并给出了缺乏逻辑的理由。这种偏离基本策略的回答,暴露出模型在特定情境下的混乱。
调整与改进
面对这些问题,奥尔特曼博士表示,GPT-5确实经历了一次重要的调整。最初版本发布时过于激进,导致其他模型直接退役。随后,OpenAI对GPT-5进行了语气更新,使其更加“亲切友好”。
奥尔特曼还提到,OpenAI正在与心理学家合作优化产品体验,并特别关注增强版记忆功能的隐私问题。虽然目前尚未解决加密问题,但未来可能会添加相关功能。
未来发展
在谈到ChatGPT的未来时,奥尔特曼表现出浓厚兴趣。他指出,GPT-6将更快推出,并且会更加智能化,能够根据用户需求进行调整。
然而,他也坦言当前模型在聊天交互方面已接近天花板,未来改进空间有限。
技术突破与挑战
值得注意的是,OpenAI正在测试一项名为“Thinking effort”的新功能。该功能允许用户选择ChatGPT的思考强度,目前有四个等级:light、standard、extended和max。
这些等级代表了模型内部运算资源的配额。配额越高,答案越深入,但响应时间也会相应增加。其中,max等级仅限高级套餐用户使用。
对于未来,奥尔特曼表示自己更关注脑机接口、能源技术等领域的发展,并认为这些方向将为AI带来更大的突破。
本文来自微信公众号:量子位(ID:QbitAI),作者:西风