OpenAI「解决」10道数学难题？哈萨比斯直呼「尴尬」，LeCun辛辣点评

作者：机器之心 2025-10-19 04:29

这个周末 AI 圈非常热闹，OpenAI 陷入舆论中心，Google、Meta 和 AI 圈多位大佬加入混战。一句话概括就是：OpenAI 研究员宣称 GPT-5 「发现」了 10 个悬赏数学难题的解决方法，舆论误以为是 GPT-5 给出了解题方法，结果被发现只是检索到了早已存在的文献，引发了学界大佬的群嘲和对于 AI 夸大宣传的激烈讨论。 GPT-5 解决悬赏难题？

这个周末 AI 圈非常热闹，OpenAI 陷入舆论中心，Google、Meta 和 AI 圈多位大佬加入混战。

一句话概括就是：OpenAI 研究员宣称 GPT-5 「发现」了 10 个悬赏数学难题的解决方法，舆论误以为是 GPT-5 给出了解题方法，结果被发现只是检索到了早已存在的文献，引发了学界大佬的群嘲和对于 AI 夸大宣传的激烈讨论。

故事要从几条引爆社交平台的推文说起。

GPT-5 解决悬赏难题？

10 月 12 日，Sebastien Bubeck 发推表示 GPT-5 文献搜索方面超凡脱俗，发现了 Erdős 问题 339 已被解决但在官方数据库中状态尚未修改。

10 月 17 日，OpenAI 研究人员 Mark Sellke 转发此贴更新，表示他和 Mehtaab 使用 GPT-5 模型进一步研究，通过数千次查询，针对 erdosproblems.com 网站上列为「开放」的 Erdős 问题进行了调查。

他们声称「发现了」10 个问题的解决方案（问题编号：223、339、494、515、621、822、883（第 2/2 部分）、903、1043、1079）。同时他们在另外 11 个问题上也取得了部分进展。

OpenAI 首席产品官 Kevin Weil 转发此贴。

这些问题源自数学家 Paul Erdős 提出的未解决问题列表，该网站由数学家 Thomas Bloom 维护。

OpenAI 的副总裁 Sebastien Bubeck 转发并宣称「AI 加速科学已正式开始」，并顺势宣布 Mark Sellke 加入 OpenAI。

一时间，公众和媒体普遍认为 GPT-5 在数学推理能力上取得了惊人突破，能够独立解决困扰人类数学家数十年的难题。

反转：「这很尴尬」

然而，这场狂欢仅仅持续了几个小时，就迎来了反转。

谷歌 DeepMind 的 CEO Demis Hassabis 在 Sebastien Bubeck 那条「AI 加速科学」的推文下回复：这很尴尬。

Hassabis 随后引导公众关注该数学难题网站维护者、数学家 Thomas Bloom 的澄清。

Thomas Bloom 表示：OpenAI 的表述为「戏剧性的误解」。网站上将这些问题标记为「未解决」，仅仅代表他个人不知道相关解答已经发表，并不意味着数学界没有人解决。

换言之，GPT-5 扮演了一个效率极高的学术搜索引擎，而非一个数学家。

Sebastien Bubeck 随后删除帖子并道歉，称「我无意误导任何人，我认为表述很清楚，对不起」。他强调，AI 在文献搜索上的作用非常有价值，因为「搜索文献有多难，我很清楚」，这能加速科学研究。

Kevin Weil 也删帖并承认「我实际上误解了我们的结果（尴尬）」。Mark Sellke 的更新也是转发此贴。

Hoisted by their own GPTards

对此，Lecun 也辛辣点评：（OpenAI）被自己吹捧 GPT 的言论坑惨了（Hoisted by their own GPTards），讽刺其作茧自缚。

注：源自莎士比亚戏剧《哈姆雷特》的著名短语 Hoist with his own petard（被自己的炸药包给炸飞了），这里 petard（炸药）改成了 GPTards（-tards 源自英文单词 retard，意为笨蛋），指代那些盲目崇拜 ChatGPT / AI 的人。

搞笑的是，就在同一天，Lecun 在一篇指出最近的热门论文《Definition of AGI》中存在虚假引用的帖子下面回复了相同的一句话。

Gary Marcus 也做出点评：任何期望当前范式接近AGI的人都是在痴心妄想。

网友也进行了激烈讨论，有部分人认为 OpenAI 再一次炒作失败。

不过也有人认为，这是一个有价值的事情。

陶哲轩的观点与此类似，他在 Mastodon 上表示，AI 在数学中的即时潜力在于加速文献搜索等琐碎任务，而非解决最难的开放问题。他承认 AI 可能「工业化」数学，加速整体进展，但强调人类专家仍需审查、分类和整合 AI 结果。

贴文地址：https://mathstodon.xyz/@tao/115385022005130505

还有人对「炒作」行为做出了更深层次的解读。

无论如何，这件事再次警醒我们，在追求技术突破的道路上，AI 社区究竟该如何平衡严谨的科学精神与必要的公众宣传？

参考链接：

https://x.com/Yuchenj_UW/status/1979422127905476778

https://x.com/ns123abc/status/1979574373435441229

https://x.com/ylecun/status/1979596956277289353

相关标签：

OpenAI

相关资讯

OpenAI低调更新GPT4o模型，多项能力反超DeepSeek

OpenAI低调更新GPT4o模型，多项能力反超DeepSeek

近日，OpenAI 对其 ChatGPT 的 GPT4o 模型进行了更新，这一消息由 OpenAI 的首席执行官 Sam Altman 在社交平台 X 上透露。 Altman 表示，此次更新是在上个周末进行的，旨在进一步提升用户的使用体验。他强调，新版本的模型在使用过程中表现出色，给用户带来了更为顺畅的体验。

2/18/2025 10:18:00 AM

AI在线

自有歪果仁为DeepSeek「辩经」：揭穿围绕DeepSeek的谣言

自有歪果仁为DeepSeek「辩经」：揭穿围绕DeepSeek的谣言

围绕 DeepSeek 的谣言实在太多了。面对 DeepSeek R1 这个似乎「一夜之间」出现的先进大模型，全世界已经陷入了没日没夜的大讨论。从它的模型能力是否真的先进，到是不是真的只用了 550W 进行训练，再到神秘的研究团队，每个角度都是话题。

2/5/2025 2:37:00 PM

机器之心

程序员购买OGOpenAI.com域名转向DeepSeek

程序员购买OGOpenAI.com域名转向DeepSeek

最近，一名软件工程师以 “不到一顿 Chipotle 餐的价格” 购买了 OGOpenAI.com 域名，并将其重定向至中国人工智能实验室 DeepSeek 的网站。该实验室在开源 AI 领域崭露头角，吸引了广泛的关注。据软件工程师阿纳奈・阿罗拉（Ananay Arora）向《TechCrunch》透露，他的初衷是为了支持 DeepSeek，因为该实验室最近推出了一款名为 DeepSeek-R1的开放版本模型，声称在某些基准测试中表现优于 OpenAI 的 o1。

1/23/2025 4:32:00 PM

AI在线

testab