又是一场酣畅淋漓的对决!
在直播间持续鏖战一小时后,《宝可梦水晶》AI主播GPT-5最终成功击败最终BOSS赤红(Red),弹幕瞬间被”GG(Good Game)”刷屏。
据推特博主Clad3815披露的战报显示:GPT-5仅用9517步便完成了通关挑战。
相较之下同类型AI o3耗费了27040步——这意味着GPT-5的通关效率达到o3的三倍之多。
换算成时间维度来看,《宝可梦水晶》对GPT-5而言是连续202小时不间断运行即可完成的任务量;
而o3则需要近一个月才能达成同等目标。
随着这场胜利引发玩家热议,在评论区已有大量观众呼吁”请继续挑战下一代宝可梦游戏”。
那么GPT-5究竟如何实现如此高效的通关表现?
在《宝可梦水晶》的经典剧情框架下——从初选小精灵、挑战道馆馆主收集徽章、破解火箭队阴谋直至决战赤红——GPT-5完美复刻了人类玩家的成长路径,并展现出碾压级优势:其主线推进速度远超o3数倍之多。
具体到关键节点数据呈现显著差异:当收集全部16枚徽章时,GPT-5仅耗时9205步,而o3却用了22334步;
在最终冲刺阶段尤为明显——从集齐徽章到击败赤红,GPT-5仅用312步即完成收尾,而o3仍需额外消耗近五千步数;
即便是在四天王与冠军战的核心剧情段落,GPT-5也以7329步完胜o3的18115步表现。
值得注意的是,本次挑战前,GPT-5已成功通关《宝可梦红》(游戏体量约为《水晶》一半),依然保持对o3三倍效率优势。
OpenAI总裁兼联合创始人Greg Brockman更亲自转发战报表示认可,引发行业关注。
对此,Clad团队总结认为:或许正是《宝可梦》系列独特的开放探索特性,为大模型能力提供了最佳展示舞台——当人类玩家通过脑补构建地图时,AI则通过标记化小地图实现空间定位;
当遭遇复杂战斗,AI能同步整合数值计算、策略规划与实时决策;
这种多层信息处理能力恰是衡量大模型上下文理解、规划执行及纠错能力的重要指标。
不过要参与这项”考试”,成本门槛相当可观:据估算,GPT-5单次通关《宝可梦红》就消耗约2.5万元人民币API费用(每token成本超4元)。
因此除非有OpenAI级别的资金支持,否则普通开发者很难将经典RPG游戏作为基准测试场景使用。
(附注:本文所述数据均来自公开测试记录及开发者披露信息)
评论列表 (0条):
加载更多评论 Loading...