AIGC宇宙 AIGC宇宙

OpenAI「解决」10道数学难题?哈萨比斯直呼「尴尬」,LeCun辛辣点评

这个周末 AI 圈非常热闹,OpenAI 陷入舆论中心,Google、Meta 和 AI 圈多位大佬加入混战。 一句话概括就是:OpenAI 研究员宣称 GPT-5 「发现」了 10 个悬赏数学难题的解决方法,舆论误以为是 GPT-5 给出了解题方法,结果被发现只是检索到了早已存在的文献,引发了学界大佬的群嘲和对于 AI 夸大宣传的激烈讨论。 GPT-5 解决悬赏难题?

这个周末 AI 圈非常热闹,OpenAI 陷入舆论中心,Google、Meta 和 AI 圈多位大佬加入混战。

一句话概括就是:OpenAI 研究员宣称 GPT-5 「发现」了 10 个悬赏数学难题的解决方法,舆论误以为是 GPT-5 给出了解题方法,结果被发现只是检索到了早已存在的文献,引发了学界大佬的群嘲和对于 AI 夸大宣传的激烈讨论。

图片

故事要从几条引爆社交平台的推文说起。

GPT-5 解决悬赏难题?

10 月 12 日,Sebastien Bubeck 发推表示 GPT-5 文献搜索方面超凡脱俗,发现了 Erdős 问题 339 已被解决但在官方数据库中状态尚未修改。

图片

10 月 17 日,OpenAI 研究人员 Mark Sellke 转发此贴更新,表示他和 Mehtaab 使用 GPT-5 模型进一步研究,通过数千次查询,针对 erdosproblems.com 网站上列为「开放」的 Erdős 问题进行了调查。

图片

他们声称「发现了」10 个问题的解决方案(问题编号:223、339、494、515、621、822、883(第 2/2 部分)、903、1043、1079)。同时他们在另外 11 个问题上也取得了部分进展。

OpenAI 首席产品官 Kevin Weil 转发此贴。

图片

这些问题源自数学家 Paul Erdős 提出的未解决问题列表,该网站由数学家 Thomas Bloom 维护。

OpenAI 的副总裁 Sebastien Bubeck 转发并宣称「AI 加速科学已正式开始」,并顺势宣布 Mark Sellke 加入 OpenAI。

图片

一时间,公众和媒体普遍认为 GPT-5 在数学推理能力上取得了惊人突破,能够独立解决困扰人类数学家数十年的难题。

反转:「这很尴尬」

然而,这场狂欢仅仅持续了几个小时,就迎来了反转。

谷歌 DeepMind 的 CEO Demis Hassabis 在 Sebastien Bubeck 那条「AI 加速科学」的推文下回复:这很尴尬

图片

Hassabis 随后引导公众关注该数学难题网站维护者、数学家 Thomas Bloom 的澄清。

Thomas Bloom 表示:OpenAI 的表述为「戏剧性的误解」。网站上将这些问题标记为「未解决」,仅仅代表他个人不知道相关解答已经发表,并不意味着数学界没有人解决。

图片

换言之,GPT-5 扮演了一个效率极高的学术搜索引擎,而非一个数学家。

Sebastien Bubeck 随后删除帖子并道歉,称「我无意误导任何人,我认为表述很清楚,对不起」。他强调,AI 在文献搜索上的作用非常有价值,因为「搜索文献有多难,我很清楚」,这能加速科学研究。

图片

Kevin Weil 也删帖并承认「我实际上误解了我们的结果(尴尬)」。Mark Sellke 的更新也是转发此贴。

图片

Hoisted by their own GPTards

对此,Lecun 也辛辣点评:(OpenAI)被自己吹捧 GPT 的言论坑惨了(Hoisted by their own GPTards),讽刺其作茧自缚。

注:源自莎士比亚戏剧《哈姆雷特》的著名短语 Hoist with his own petard(被自己的炸药包给炸飞了),这里 petard(炸药)改成了 GPTards(-tards 源自英文单词 retard,意为笨蛋),指代那些盲目崇拜 ChatGPT / AI 的人。

图片

搞笑的是,就在同一天,Lecun 在一篇指出最近的热门论文《Definition of AGI》中存在虚假引用的帖子下面回复了相同的一句话。

图片

Gary Marcus 也做出点评:任何期望当前范式接近AGI的人都是在痴心妄想。

图片

网友也进行了激烈讨论,有部分人认为 OpenAI 再一次炒作失败。

图片

不过也有人认为,这是一个有价值的事情。

图片

陶哲轩的观点与此类似,他在 Mastodon 上表示,AI 在数学中的即时潜力在于加速文献搜索等琐碎任务,而非解决最难的开放问题。他承认 AI 可能「工业化」数学,加速整体进展,但强调人类专家仍需审查、分类和整合 AI 结果。

图片
  • 贴文地址:https://mathstodon.xyz/@tao/115385022005130505

还有人对「炒作」行为做出了更深层次的解读。

图片

无论如何,这件事再次警醒我们,在追求技术突破的道路上,AI 社区究竟该如何平衡严谨的科学精神与必要的公众宣传?

参考链接:

https://x.com/Yuchenj_UW/status/1979422127905476778

https://x.com/ns123abc/status/1979574373435441229

https://x.com/ylecun/status/1979596956277289353

相关资讯

OpenAI低调更新GPT4o模型,多项能力反超DeepSeek

近日,OpenAI 对其 ChatGPT 的 GPT4o 模型进行了更新,这一消息由 OpenAI 的首席执行官 Sam Altman 在社交平台 X 上透露。 Altman 表示,此次更新是在上个周末进行的,旨在进一步提升用户的使用体验。 他强调,新版本的模型在使用过程中表现出色,给用户带来了更为顺畅的体验。
2/18/2025 10:18:00 AM
AI在线

自有歪果仁为DeepSeek「辩经」:揭穿围绕DeepSeek的谣言

围绕 DeepSeek 的谣言实在太多了。 面对 DeepSeek R1 这个似乎「一夜之间」出现的先进大模型,全世界已经陷入了没日没夜的大讨论。 从它的模型能力是否真的先进,到是不是真的只用了 550W 进行训练,再到神秘的研究团队,每个角度都是话题。
2/5/2025 2:37:00 PM
机器之心

程序员购买OGOpenAI.com域名转向DeepSeek

最近,一名软件工程师以 “不到一顿 Chipotle 餐的价格” 购买了 OGOpenAI.com 域名,并将其重定向至中国人工智能实验室 DeepSeek 的网站。 该实验室在开源 AI 领域崭露头角,吸引了广泛的关注。 据软件工程师阿纳奈・阿罗拉(Ananay Arora)向《TechCrunch》透露,他的初衷是为了支持 DeepSeek,因为该实验室最近推出了一款名为 DeepSeek-R1的开放版本模型,声称在某些基准测试中表现优于 OpenAI 的 o1。
1/23/2025 4:32:00 PM
AI在线
testab