近日,在备受瞩目的”人工智能国际象棋表演赛”中,OpenAI的o3模型凭借卓越实力摘得桂冠,成功击败了xAI公司的Grok 4。本次赛事由谷歌旗下Kaggle平台主办,吸引了八款顶尖AI模型同场竞技。经过三天激烈角逐,最终决出了前三名。
比赛特别要求所有参赛AI必须在未经针对性训练的情况下参赛,仅能从互联网获取国际象棋相关知识作为准备。在关键的决赛中,o3以4-0的绝对优势横扫Grok 4,并且在三场比赛中均以同样比分轻松胜出。此前,o3还在半决赛阶段击败了同门师兄o4 mini。
尽管未能夺冠,Grok 4在整个比赛过程中依然展现了不俗实力。在决赛前,它已先后淘汰了谷歌的Gemini 2.5 Flash和Gemini 2.5 Pro两款强劲对手。有趣的是,在赛前,xAI创始人埃隆·马斯克曾表示,其团队几乎未对Grok 4进行针对性训练。
国际象棋权威媒体Chess.com的总编辑佩德罗·平哈特指出,Grok 4在半决赛前表现无敌,但最终在决赛中优势被打破。著名国际象棋大师中村光在解说中提到,Grok 4在比赛中出现了多次失误,而o3则始终发挥稳定。另一位解说嘉宾、国际棋联排名第一的芒努斯·卡尔森评价称,决赛中的两个AI表现相当于刚接触规则的新手水平,大约800ELO分左右。他认为这些模型虽然在吃子计算方面表现出色,但在战术执行和大局把控上仍有明显不足。
值得注意的是,在国际象棋领域,专用AI系统仍然占据明显优势。例如,2019年击败韩国围棋名手李世石的AlphaGo,以及上世纪击败世界冠军加里·卡斯帕罗夫的”深蓝”超级计算机,都是为特定棋类量身打造的专业程序。今年早些时候,在国际象棋大师Levy Rozman举办的一场锦标赛中,Grok和ChatGPT均不敌专为国际象棋设计的Stockfish AI系统。