8月14日消息,在上周举行的“人工智能国际象棋表演赛”中,OpenAI的o3模型以出色的表现赢得了冠军,在决赛中战胜了xAI的Grok4。此次比赛在谷歌旗下的Kaggle平台举办,共有八个AI模型参与角逐,经过三天的淘汰赛,最终决出冠亚季军。
比赛规则要求AI模型在未经过专门训练的情况下参赛,仅能在赛前从互联网上获取国际象棋相关知识。在决赛中,o3以4-0的比分横扫Grok4,且在三场比赛中均以4-0的比分获胜,还在半决赛中轻松击败了同门的o4mini。
相比之下,Grok4在决赛前也展现了强大的实力,先后淘汰了谷歌的Gemini2.5Flash和Gemini2.5Pro。当时,xAI的创始人埃隆・马斯克曾表示,xAI“基本没在象棋上花功夫”。
注意到,国际象棋对弈网站Chess.com的总编辑PedroPinhata指出,Grok4在半决赛前似乎无人能敌,但在最后一天的比赛中,其优势被打破。国际象棋大师中村光在直播中评论称,Grok4在比赛中犯了很多错误,而OpenAI的o3则表现出色。另一位解说嘉宾、国际棋联世界排名第一的芒努斯・卡尔森表示,决赛中两个AI的水平相当于刚学会规则的普通棋手,大约800ELO(等级分)。他指出,这些模型在计算吃子方面表现出色,但在将死对手方面则显得不足,更像“擅长收集食材,却不会做饭”。
值得注意的是,此前在国际象棋领域,专为该棋类设计的人工智能系统表现更为出色。例如,2019年击败韩国棋手李世石的AlphaGo和上世纪击败国际象棋大师加里・卡斯帕罗夫的超级电脑“深蓝”,都是为特定棋类定制的程序。今年早些时候,在国际象棋大师LevyRozman举办的锦标赛中,Grok和ChatGPT均输给了专为国际象棋设计的人工智能系统Stockfish。
比赛具体成绩如下: