谷歌Gemini2.5Pro AI首通关29年经典《宝可梦蓝》

AI资讯21小时前发布 ainav
3 0

5月4日,科技界传来重大消息:谷歌最先进的人工智能模型取得突破性进展,成功通关了一款发布于29年前的经典电子游戏。

谷歌Gemini2.5Pro AI首通关29年经典《宝可梦蓝》

谷歌首席执行官桑达尔·皮查伊在社交平台X上兴奋地宣布:”太精彩了!Gemini 2.5 Pro刚刚完成了《宝可梦蓝》!”

据悉,这次直播活动名为”Geniim Plays Pokemon”,是由一位名叫Joel Z的30岁软件工程师发起的项目。尽管Joel Z并非谷歌员工,但谷歌高管对这一尝试表示了高度关注和支持。值得注意的是,Gemini在完成《宝可梦》游戏的过程中展现出了令人惊叹的能力——它已经成功获得了第五个徽章,目前的表现仅次于最优秀的模型,但后者仅获得三个徽章,并且使用了不同的代理框架。皮查伊还幽默地表示:”我们正在开发一个全新的API,就叫’人工宝可梦智能’吧!”

那么,为何选择《宝可梦》作为测试对象呢?早在今年2月,Anthropic公司就已经展示了其Claude AI模型在《宝可梦红》中的出色表现。然而,Claude似乎尚未完全通关《宝可梦红》,这不禁让人思考:Gemini的表现是否真的技高一筹?对此,Joel Z在其Twitch频道上特别提醒观众:”请不要将此视为衡量大型语言模型(LLM)玩宝可梦能力的唯一标准。因为Gemini和Claude使用的工具和接收到的信息都有所不同,两者之间并不具备直接可比性。”

事实上,无论是Gemini还是Claude,这些AI模型都需要借助代理框架才能完成游戏任务。这些框架能够为模型提供带有额外信息的游戏截图,帮助模型做出决策,并通过调用专业代理来执行相应的操作。

Joel Z坦承,在帮助Gemini通关的过程中,他确实进行了一些”开发干预”,但他强调这并非作弊行为。他表示:”我的干预主要是为了提升Gemini的整体决策和推理能力。我不会给出具体的提示词,也不会为特定挑战提供攻略或直接指令。最接近的情况是,我告诉Gemini需要与火箭队小兵对话两次才能获得升空钥匙——这是一个在《宝可梦黄》中已经被修复的漏洞。”

Joel Z还透露:”Gemini Plays Pokémon项目仍在积极开发中,其框架也在不断优化和完善。这一项目的成功展示出了AI技术的巨大潜力,未来我们有望看到更多令人惊叹的应用场景。”

© 版权声明

相关文章