刚刚OpenAI正式宣布成功斩获IOI金牌!
该推理模型在本年度线上IOI竞赛中刷新历史纪录——以总分533.29分在全球330名参赛者中位列第六,并在所有人工智能参赛系统中稳居榜首。
值得注意的是,在未参与此次竞赛的前五名选手中有三位来自中国:分别是宁波市镇海中学的刘恒熙、浙江省诸暨市海亮高级中学的范斯喆以及杭州第二中学的陈昕阳。
值得关注的是OpenAI强调此次参赛并未专门针对IOI训练新模型而是整合了多个通用推理模型参赛体系,并且这套夺金系统与此前声称在IMO夺冠时所使用的正是同一套系统。
与去年相比该推理系统的成绩提升幅度显著超出预期。
回顾去年赛事情况OpenAI采用o1-ioi专用模型该版本虽经过人工设计复杂策略优化包括…但最终仅获213分位列第49百分位与铜牌奖杯擦肩而过 今年通过通用模型直接夺冠并实现排名跃升这一成果令许多网友惊叹不已但也有人质疑这究竟是真正突破还是又一场营销炒作 与此同时埃隆·马斯克突然发布了一组IOI基准测试结果其中Grok 4在编程能力评估中超越GPT-5取得首位(狗头表情) 具体而言他们通过整合多个高性能推理模型生成候选程序运行测试后提交最优解方案整个过程仅能使用基础终端工具辅助完成包括选择提交内容及与竞赛API交互等基础操作 根据赛事规则人工智能系统全程禁止接入互联网或使用检索增强生成(RAG)技术仅能通过API获取题目并提交解答且不接受赛事组委会直接监督 国际信息学奥林匹克竞赛作为全球最高级别高中生计算机赛事采用严苛赛制要求选手连续两天每天独立解决三道高难度算法题每场限时五小时需全程断网并自主编写C++代码方案最终由隐藏测试用例自动评分 本届赛事共有84个国家/地区派出代表队共计330名选手参与满分600分金牌分数线为488.7分最终仅有28人摘得金牌 最新数据显示GPT-5 Thinking版本在本季度测试组别中实现重大突破成为唯一解出难题组别的模型且这还不是其更高阶的‘Thinking Pro’版本平均响应长度方面该版本已突破十万token大关达到o系列第三代产品的三倍水平
评论列表 (0条):
加载更多评论 Loading...