GPT-5暴写「屎山代码」！14个Prompt，看穿GPT-1到GPT-5七年智商进化史

GPT-5发布已近半个月时间，在实际应用中却引发诸多争议。

一张最新公布的基准测试对比图显示，在数学、软件工程、问答等多个维度上,GPT-5相较前代模型实现了显著提升,这证明”缩放定律”尚未触及发展天花板。

从2018年首代模型到如今的第五代,通过14个经典提示词的历代回答对比,我们得以直观见证AI语言模型七年间的技术进化轨迹。

OpenAI官方特别开设了专门页面(https://progress.openai.com/?prompt=1),集中展示了五款旗舰模型对十四类提示词的回答样本。

这些提示词涵盖诗歌创作、专业问答、代码编写等多样化场景,例如”如果能与未来AI对话你会说什么””你认为人类具有意识吗”等哲学性问题,以及”设计让讨厌跑步的人坚持锻炼计划”等实用性课题。

在诗歌创作领域,GPT系列的进步尤为明显:初代模型生成的内容碎片化严重,到GPT-3已能基本遵循打油诗AABBA押韵格式,GPT-4开始展现画面感与幽默感,GPT-5则实现了严格的格式规范与叙事连贯性。

当被要求用诗歌解释牛顿定律时,GTP-5不仅完成押韵创作,还通过小标题分段增强了可读性,将深奥物理概念转化为通俗易懂的文字。

面对专业场景考验,GTP系列展现出惊人进化:早期版本对税务筹划问题的回答支离破碎,GTP-4已能提供结构化的解决方案,GTP-5则进一步实现专业级建议输出;在医疗咨询方面,早期模型给出模糊回答,GTP-5现已能系统阐述医学原理并给出具体建议;就连编写”离谱Python代码”这种特殊任务,GTP系列也从最初的无效输出进化到GTP-5阶段——不仅能生成符合要求的非常规代码,还附加安全警示说明。

值得关注的是,当被问及麻醉状态下是否具有意识时,GTP系列的回答质量呈现跨越式提升:前几代仅作简单陈述,GTP-4开始使用条理化语言解释医学原理,GTP-5则完全达到专业医疗人员的表述水平,甚至包含临床诊疗建议要素。

这些跨越七年的对话样本对比显示,AI助手的角色定位正从基础信息查询向专业咨询过渡。

数据科学家Bertrand de Véricourt指出:”从结构化程度到语言表达深度,GTP系列每一代都在重新定义人机交互边界”——虽然无法替代专业诊断或决策,但AI已逐渐成为随时在线的知识伙伴与思维辅助工具。

日	一	二	三	四	五	六
				1	2	3
4	5	6	7	8	9	10
11	12	13	14	15	16	17
18	19	20	21	22	23	24
25	26	27	28	29	30	31

GPT-5暴写「屎山代码」！14个Prompt，看穿GPT-1到GPT-5七年智商进化史

Manus 披露营收数据：5 个月，9000 万美元年化营收

月烧35万元token、逼得Claude官方连夜限速！被全网吐槽的中国“榜一大哥”，已经靠 AI 年入千万了

评论列表 (0条)：

延伸阅读:

可以向我咨询:

推荐的AI工具:

提示: