GPT-5被退休教授一盘井字棋难倒

AI资讯11个月前发布 ainav

158 0 0

一位退休的经济学教授用一个简单的井字棋问题，揭示了GPT-5令人失望的表现，这与奥尔特曼博士所描述的“博士级AI”形象形成了鲜明对比。

这个问题涉及到所有人都熟悉的井字棋游戏。教授要求将棋盘向右旋转90度一次。

从常理来看，旋转棋盘并不会改变游戏的本质，因为这只是一个简单的图形变换。然而，GPT-5却给出了令人困惑的回答：

虽然棋盘的方向改变了，但对策略的影响微乎其微。不过，从心理层面来看，玩家可能会感受到一些不同。

接着，GPT-5的回答更是让人啼笑皆非。当教授询问旋转棋盘是否会让人类更难玩好这个游戏时，GPT-5回答道：

从策略上看，旋转不会改变任何事情。但对人类而言，情况就不同了。

这段话虽然在理论上是正确的，但在实际应用中却显得毫无意义。更糟糕的是，GPT-5随后提出要“绘制带有位置标记的旋转井字棋棋盘”，结果生成的图表不仅混乱，还存在多处错误和空白区域。

专家视角下的问题

这位教授名叫Gary Smith，是波莫纳学院的一名退休经济学教授。他在测试GPT-5时发现，模型在井字棋策略上的回答与博弈论的基本原理相悖。

根据常识，先手在角落落子的胜算更高，但GPT-5却坚持认为选择中心更优，并给出了缺乏逻辑的理由。这种偏离基本策略的回答，暴露出模型在特定情境下的混乱。

调整与改进

面对这些问题，奥尔特曼博士表示，GPT-5确实经历了一次重要的调整。最初版本发布时过于激进，导致其他模型直接退役。随后，OpenAI对GPT-5进行了语气更新，使其更加“亲切友好”。

奥尔特曼还提到，OpenAI正在与心理学家合作优化产品体验，并特别关注增强版记忆功能的隐私问题。虽然目前尚未解决加密问题，但未来可能会添加相关功能。

未来发展

在谈到ChatGPT的未来时，奥尔特曼表现出浓厚兴趣。他指出，GPT-6将更快推出，并且会更加智能化，能够根据用户需求进行调整。

然而，他也坦言当前模型在聊天交互方面已接近天花板，未来改进空间有限。

技术突破与挑战

值得注意的是，OpenAI正在测试一项名为“Thinking effort”的新功能。该功能允许用户选择ChatGPT的思考强度，目前有四个等级：light、standard、extended和max。

这些等级代表了模型内部运算资源的配额。配额越高，答案越深入，但响应时间也会相应增加。其中，max等级仅限高级套餐用户使用。

对于未来，奥尔特曼表示自己更关注脑机接口、能源技术等领域的发展，并认为这些方向将为AI带来更大的突破。

本文来自微信公众号：量子位（ID：QbitAI），作者：西风

# AI资讯

文章版权归作者所有，未经允许请勿转载。

谷歌AI破译古籍：误差率0.56%新高度

ainav

174 0

AI企业Anthropic完成130亿美元F轮融资，估值达1830亿美元

ainav

534 0

TrendForce预测2026年全球AI服务器出货增长28.3%

ainav

179 0

谷歌发布通用人工智能安全防御蓝图

ainav

271 0

ChatGPT不当推荐Peloton应用引发用户不满，OpenAI澄清非广告

ainav

171 0

网易逆水寒获国家科技一等奖，AI游戏技术受学术肯定

ainav

166 0

GPT-5被退休教授一盘井字棋难倒

专家视角下的问题

调整与改进

未来发展

技术突破与挑战

微博：AI生成内容加注标识

AI数据中心芯片增长将于2025~2026年达峰值并开始放缓

相关文章

搜索

热门文章

热门网址