AIGC宇宙 AIGC宇宙

人类击败OpenAI守住编程冠军!10小时激战两次反超,AI最后关头功亏一篑

10小时激战! 人类最后关头实现超越,获得编程总决赛冠军~而原本始终保持领先优势的OpenAI,最终屈居第二。 在刚刚落幕的AtCoder世界巡回总决赛上,12名决赛选手两天时间里展开角逐。

10小时激战!人类最后关头实现超越,获得编程总决赛冠军~

而原本始终保持领先优势的OpenAI,最终屈居第二。

图片

在刚刚落幕的AtCoder世界巡回总决赛上,12名决赛选手两天时间里展开角逐。

结果过程还挺紧张刺激,尤其前两名的争夺上。

OpenAI 在大部分比赛中都排名第一,本以为就这样了。人类开始反超,结果还剩1小时20分钟的时候,OpenAI又重新领先。不过还是没有坚持到最后。

图片

OpenAI总裁Greg Brockman发来贺电,中间还夹带私货:OpenAI位居第二。

图片

此时获得冠军的人类表示要累死了

因为过去三天我估计只睡了10个小时,现在都快撑不住了。

图片

网友:你看,模型就不会这样

图片

好好,到底还是人类机灵啊~~

10小时激战:人类两次反超锁定胜局

AtCoder是一个全球性质的日本编程竞赛网站,任何人都可以随时参加,挑战历年的5000道真题。

如果排名优异(前12名),将有机会前往日本参与一年一度的世界巡回总决赛。

图片

它有两种类型的竞赛:算法类和启发式,OpenAI参与的是后者,与12位优异人类同台竞技。每位选手都有个这样的介绍卡片。

图片

算法类,参赛者需要提交一个程序,快速准确地解决给定的问题,谁答对的多谁就胜。

启发式是2021年才开始评级、2024年才开始竞赛的类别。在这类比赛中,参赛者比拼的是他们能在规定时间(10小时内)找到最优解。

比如,考虑一条追踪100个点返回的路径。那么最右边这个方法将获得最高分。

图片

比赛期间你可以提交任何编程语言,并且支持重复提交,不过两次提交之间至少要间隔5分钟。不过提交一次错误答案就要扣时间。

此次比赛全程直播。OpenAI参赛的模型叫做OpenAI-AHC,从提交的记录来看,前期发挥得都很不错。

前六个小时提交的回答,全都是得分点,第一次提交就有31万得分。

图片图片

比赛还剩下三个小时的时候,OpenAI依然是稳居第一。

图片

但是在后半程开始出现失误,好几道题出现「执行时间超出限制」的情况,导致零分。

图片

反观Psycho,就显得十分稳定,全是绿灯。

图片

尤其他第一次提交,就获得了六百多万的得分。

图片

于是就在还剩两小时四十分钟的时候,他直接完成了反超。

图片

而且相差的分数还不小。

图片

后面正如Greg所说,还剩下一个多小时的时候,OpenAIAHC再次反超。

图片

这种局势一直稳定在还剩46分钟时,就在Psycho提交之后,再次回到了第一的位置,结果就直接稳定到最后了。

图片

By the way,OpenAI的提交次数已经是人类的好几倍了。随便拎出个人类选手,提交次数一页就可以浏览完。

图片

结果一出,不少人想起之前几次人机大战的比赛。

图片

网友表示:看来这是人类最后一次胜利。

图片

冠军还曾效力OpenAI,训练AI战胜人类

值得一提的是,这位来自波兰的Psycho,与OpenAI和Greg是有点渊源在的。

从他个人介绍来看,他是个游戏设计者,也是个职业竞技程序员。

但以前在OpenAI待过,于是顺藤摸瓜找到了当时2019年的一篇文章。

图片

当时OpenAI Five在Dota 2游戏里击败世界冠军,成为首个电竞比赛中战胜人类的AI系统。

而他所在团队利用强化学习进行大规模训练,就在OpenAI Five持续训练10个月后,终于战胜了世界冠军。

当时这篇论文也还有Greg Brockman参与。

六年之前,他在OpenAI训练AI,要AI战胜人类。

六年之后,他站在了人类选手这一边,挑战自己老东家的大模型,结果挑战成功了。

Interesting~

此次对于Greg的祝贺,他回应道,谢谢你让我的生活更有趣,现在我回去准备退休了。

图片

顺便说一嘴,今年这场比赛还是由OpenAI赞助的。

第一名可以获得50万日元,差不多两万四人民币。第二名能获得九千六百多元。

图片

嗯看来,OpenAI这一波,还是有实际的收获的(Doge)。

10小时赛程回放:https://www.youtube.com/live/TG3ChQH61vE

相关资讯

OpenAI播客再谈AI编程大战!开发者是最有福的人:特定需求的代码模型将涌现!主持人说漏嘴:我最喜欢Claude!

编译、整理 | 伊风出品 | 51CTO技术栈(微信号:blog51cto)OpenAI第二期播客来了! 阵容也是相当重磅! 嘉宾是OpenAI 首席研究官 马克·陈(Mark Chen)和ChatGPT 负责人 尼克·特利(Nick Turley)。
7/3/2025 7:55:29 AM
伊风

返老还童,OpenAI做到了?首个逆龄AI将登场,人类寿命可延长10年

超级智能要来了? 人类「长生不老」有希望了? 外媒称,OpenAI开发出了首款用于「长寿」的AI模型 ——GPT-4b micro,预计将人类寿命延长10年。
1/20/2025 9:13:00 AM
新智元

OpenAI掀「百万美金」编程大战!Claude 3.5 Sonnet狂赚40万拿下第一

昨天马斯克刚刚发布了号称「地表最聪明」的Grok 3模型,抢走了所有关注。 这边OpenAI就开始坐不住了,立刻扔出了SWE-Lancer(AI编码测试基准),看一下AI到底能在现实任务中挣到多少钱。 SWE-Lance是一个全新的、更贴近现实的基准测试,用于评估AI模型的编码性能。
2/19/2025 4:01:37 PM
新智元
  • 1