AIGC宇宙 AIGC宇宙

35分斩金!Gemini 成首个 IMO 认证 AI 金牌 ,OpenAI 未获许可强蹭 IMO 热度

Gemini Deep Think正式跨入国际数学奥林匹克(IMO)金牌行列。 谷歌DeepMind宣布,其搭载Deep Think模式的先进版本Gemini,在2025年IMO中斩获35分,成功达到了金牌标准。 这一成绩来自对6道题中的5道完美解答,评分标准、比赛时间、参赛流程与人类选手完全一致。

Gemini Deep Think正式跨入国际数学奥林匹克(IMO)金牌行列。

谷歌DeepMind宣布,其搭载Deep Think模式的先进版本Gemini,在2025年IMO中斩获35分,成功达到了金牌标准。

这一成绩来自对6道题中的5道完美解答,评分标准、比赛时间、参赛流程与人类选手完全一致。

图片图片

更关键的是,这是IMO官方首次对AI参赛结果进行正式认证,并给出与学生相同的评分机制。

IMO主席Gregor Dolinar明确表示:“我们可以确认,Google DeepMind达到了这一备受期待的里程碑。解答清晰、精准,大多数都易于理解。”

图片图片

要知道,去年的银牌得主是DeepMind旗下的AlphaProof与AlphaGeometry组合系统,用了两到三天的时间、依赖形式语言翻译,才完成28分的成绩。

今年的Gemini Deep Think,在4.5小时内用英语读题、用英语写出完整证明,全程自然语言,端到端完成任务,完成了从“翻译数学”到“思维数学”的跨越。

DeepMind科学家Thang Luong称,这是AI在数学理解领域的“范式转变”。

更引人注目的是,这款Gemini新模型尚未公开,但DeepMind已承诺将先开放给受信任的数学家进行测试,后续逐步向Google AI Ultra用户推出。

一、技术之上,是节奏与分寸

然而,在DeepMind宣布突破之前,另一场围绕“谁先发声”的风波,先点燃了整个AI圈。

知情者透露,DeepMind其实在7月19日(周五)下午就完成了内部验证。但为了配合IMO官方“闭幕式后一周再公布”的非正式约定,他们决定等到下周一再正式发布。

图片图片

没想到,OpenAI在19日凌晨突然宣布:“我们也做到了!”

结果,所有注意力一夜之间倾斜向了OpenAI,DeepMind的节奏被彻底打乱。

社交平台瞬间炸开了锅。有推特网友一针见血地指出:“在这个游戏里,速度大于官僚主义。错过时机,你就失去了话语权。”

而据IMO相关协调员透露,OpenAI并未与IMO官方合作测试其模型,可能“并不知道”需要等待闭幕式之后才宣布。

图片图片

OpenAI研究员Noam Brown随后澄清称,他们确实在闭幕式结束后才公布成绩,并事先知会了部分组织者。

但据IMO内部人员披露,OpenAI其实在闭幕晚会前就公布了结果,这种行为被评价为“粗鲁和不恰当”。

图片图片

DeepMind CEO哈萨比斯虽然在推文中“只字未提”OpenAI,却通过强调三个点回应了全部质疑:我们没有抢跑,成绩是IMO官方认证,模型也会正式发布。

这三点,恰恰击中了OpenAI的三个软肋。

不仅DeepMind的节奏更体面,他们在技术层面也选择了更高成本、更针对性的AI模型研发路径。

Gemini Deep Think并非通用模型,而是一个专为复杂问题设计的增强推理系统,融合了DeepMind最新的研究成果。

而OpenAI的做法,则被不少网友评价为“通用模型,低资源,博营销”。

二、增强推理,迈向直觉

图片图片

Gemini Deep Think最核心的优势,来自它独特的“并行思维”能力。

在解题过程中,模型不再像传统AI那样顺着一条逻辑线推演,而是同时展开多个可能的解法路径,并在最终组合成最优方案后给出答案。

这让它拥有比人类更广阔的思维幅度,又不失推理的严谨性。

此外,为进一步发挥推理能力,DeepMind采用了多项技术升级:使用全新的强化学习方式训练模型;提供高质量的数学问题和解答数据集;加入专门的IMO题目解题提示与策略指令。

更惊人的是,在今年的第三题中,大部分人类选手使用了研究生级别的技巧完成,而Gemini仅用初等数论,就完成了一个逻辑自洽的完整证明。

至于那唯一没有解出的第六题?据说人类选手中也仅有五人解出。Gemini只是“选错了方向”。

目前,DeepMind已将Gemini解答的五道题目完整公开,接受全网检验。

与Gemini Deep Think同时被提及的,还有DeepMind之前的形式化系统:AlphaProof和AlphaGeometry。

图片图片

虽然今年Gemini完全依赖自然语言完成任务,但DeepMind明确表示,这两条路线仍会并行推进。

他们的目标,是构建一个既能理解人类语言,又能进行严格形式证明的“超级数学助手”。

这种AI,将不止用于数学竞赛,还能成为科学研究、工程设计、理论建模等领域的核心工具。

相关资讯

IMO怒斥OpenAI自封夺金,“91位评委均未参与评分”,网友:炒作无下限

OpenAI声称新模型获得IMO金牌不到24小时,剧情就出现了大反转! 多位IMO官方人士和学界大佬纷纷发声,直指OpenAI的做法“粗鲁且不恰当”。 IMO主办方要求AI公司在闭幕式一周后再公布结果,让关注的焦点留在参赛的青少年上,然而OpenAI偏偏选择在闭幕式刚结束就急不可耐地宣布了成绩。
7/21/2025 2:27:44 PM

OpenAI被曝IMO金牌「造假」,陶哲轩怒揭内幕!

OpenAI夺下IMO金牌,最新大瓜又来了。 昨日,因内部审核流程,谷歌DeepMind研究员在评论区,暗讽OpenAI抢先发布测试结果。 图片原来,事情并非那么简单。
7/21/2025 11:48:54 AM
新智元

陶哲轩回应 OpenAI 新模型 IMO 夺金,GPT-5 测试版曝光

OpenAI 最新模型曝光了,在 2025 年国际数学奥林匹克竞赛(IMO)上达到了金牌水平! IMO 被公认为全球最顶尖的数学竞赛,每年只有不到 8% 的参赛者能够获得金牌。 而现在,一个 AI 模型做到了。
7/20/2025 11:29:30 AM
  • 1