GPT-5通关《宝可梦水晶》创纪录！9517步击败赤爷，效率碾压o3三倍！

又是一场酣畅淋漓的对决！

在直播间持续鏖战一小时后，《宝可梦水晶》AI主播GPT-5最终成功击败最终BOSS赤红（Red），弹幕瞬间被”GG（Good Game）”刷屏。

据推特博主Clad3815披露的战报显示：GPT-5仅用9517步便完成了通关挑战。

相较之下同类型AI o3耗费了27040步——这意味着GPT-5的通关效率达到o3的三倍之多。

换算成时间维度来看，《宝可梦水晶》对GPT-5而言是连续202小时不间断运行即可完成的任务量；

而o3则需要近一个月才能达成同等目标。

随着这场胜利引发玩家热议，在评论区已有大量观众呼吁”请继续挑战下一代宝可梦游戏”。

那么GPT-5究竟如何实现如此高效的通关表现？

在《宝可梦水晶》的经典剧情框架下——从初选小精灵、挑战道馆馆主收集徽章、破解火箭队阴谋直至决战赤红——GPT-5完美复刻了人类玩家的成长路径，并展现出碾压级优势：其主线推进速度远超o3数倍之多。

具体到关键节点数据呈现显著差异：当收集全部16枚徽章时,GPT-5仅耗时9205步,而o3却用了22334步；

在最终冲刺阶段尤为明显——从集齐徽章到击败赤红,GPT-5仅用312步即完成收尾,而o3仍需额外消耗近五千步数；

即便是在四天王与冠军战的核心剧情段落,GPT-5也以7329步完胜o3的18115步表现。

值得注意的是,本次挑战前,GPT-5已成功通关《宝可梦红》(游戏体量约为《水晶》一半),依然保持对o3三倍效率优势。

OpenAI总裁兼联合创始人Greg Brockman更亲自转发战报表示认可,引发行业关注。

对此,Clad团队总结认为:或许正是《宝可梦》系列独特的开放探索特性,为大模型能力提供了最佳展示舞台——当人类玩家通过脑补构建地图时,AI则通过标记化小地图实现空间定位；

当遭遇复杂战斗,AI能同步整合数值计算、策略规划与实时决策；

这种多层信息处理能力恰是衡量大模型上下文理解、规划执行及纠错能力的重要指标。

不过要参与这项”考试”,成本门槛相当可观:据估算,GPT-5单次通关《宝可梦红》就消耗约2.5万元人民币API费用(每token成本超4元)。

因此除非有OpenAI级别的资金支持,否则普通开发者很难将经典RPG游戏作为基准测试场景使用。

（附注：本文所述数据均来自公开测试记录及开发者披露信息）