谷歌Gemini2.5Pro AI首通关29年经典《宝可梦蓝》

AI资讯1年前 (2025)发布 ainav

148 0 0

5月4日，科技界传来重大消息：谷歌最先进的人工智能模型取得突破性进展，成功通关了一款发布于29年前的经典电子游戏。

谷歌首席执行官桑达尔·皮查伊在社交平台X上兴奋地宣布：”太精彩了！Gemini 2.5 Pro刚刚完成了《宝可梦蓝》！”

据悉，这次直播活动名为”Geniim Plays Pokemon”，是由一位名叫Joel Z的30岁软件工程师发起的项目。尽管Joel Z并非谷歌员工，但谷歌高管对这一尝试表示了高度关注和支持。值得注意的是，Gemini在完成《宝可梦》游戏的过程中展现出了令人惊叹的能力——它已经成功获得了第五个徽章，目前的表现仅次于最优秀的模型，但后者仅获得三个徽章，并且使用了不同的代理框架。皮查伊还幽默地表示：”我们正在开发一个全新的API，就叫’人工宝可梦智能’吧！”

那么，为何选择《宝可梦》作为测试对象呢？早在今年2月，Anthropic公司就已经展示了其Claude AI模型在《宝可梦红》中的出色表现。然而，Claude似乎尚未完全通关《宝可梦红》，这不禁让人思考：Gemini的表现是否真的技高一筹？对此，Joel Z在其Twitch频道上特别提醒观众：”请不要将此视为衡量大型语言模型（LLM）玩宝可梦能力的唯一标准。因为Gemini和Claude使用的工具和接收到的信息都有所不同，两者之间并不具备直接可比性。”

事实上，无论是Gemini还是Claude，这些AI模型都需要借助代理框架才能完成游戏任务。这些框架能够为模型提供带有额外信息的游戏截图，帮助模型做出决策，并通过调用专业代理来执行相应的操作。

Joel Z坦承，在帮助Gemini通关的过程中，他确实进行了一些”开发干预”，但他强调这并非作弊行为。他表示：”我的干预主要是为了提升Gemini的整体决策和推理能力。我不会给出具体的提示词，也不会为特定挑战提供攻略或直接指令。最接近的情况是，我告诉Gemini需要与火箭队小兵对话两次才能获得升空钥匙——这是一个在《宝可梦黄》中已经被修复的漏洞。”

Joel Z还透露：”Gemini Plays Pokémon项目仍在积极开发中，其框架也在不断优化和完善。这一项目的成功展示出了AI技术的巨大潜力，未来我们有望看到更多令人惊叹的应用场景。”

# AI资讯