GPT-5.2 生成字母挂图错误频出，“人类专家水平”遭质疑

作者：清源 2025-12-20 05:11

AI在线 12 月 20 日消息，12 月 11 日，OpenAI 发布了 ChatGPT-5.2，并照例将这次更新描述为一次“通用智能的重大提升”，称其是目前最适合现实世界专业使用的模型，甚至表示这是首个在表现上达到或超过人类专家水平的版本。当地时间 12 月 18 日，据外媒 Futurism 报道，在一个极其基础的测试中，上述说法很快受到了质疑。在实测为小学生生成一张按英文字母顺序排列的动物挂图时，结果漏洞百出。

AI在线 12 月 20 日消息，12 月 11 日，OpenAI 发布了 ChatGPT-5.2，并照例将这次更新描述为一次“通用智能的重大提升”，称其是目前最适合现实世界专业使用的模型，甚至表示这是首个在表现上达到或超过人类专家水平的版本。

当地时间 12 月 18 日，据外媒 Futurism 报道，在一个极其基础的测试中，上述说法很快受到了质疑。在实测为小学生生成一张按英文字母顺序排列的动物挂图时，结果漏洞百出。

这一问题最早由 BCA Research 首席全球策略师彼得・贝雷津发现。他在 11 月发布的 ChatGPT-5.1 上提出同样的指令，模型思考了数秒后生成的内容却只包含 25 个字母，而标准英文字母表应为 26 个。

贝雷津对此调侃称：“看来还需要更多资本支出”，影射 OpenAI 已承诺在 2025 年投入 1.15 万亿美元（AI在线注：现汇率约合 8.11 万亿元人民币）用于硬件。

在测试 ChatGPT-5.2 时，问题依然存在。个别字母对应的动物有所改善，但模型仍只覆盖了 24 个字母，遗漏了“U”和“Z”，并在“T”之后直接跳到“Y”，对应“Yak”。生成的字母表最终以“X”结束，对应“X-ray fish”，插图却是一只斑马。

GPT-5.2 生成字母挂图错误频出，“人类专家水平”遭质疑

插图本身也存在明显异常，例如肢体结构怪异的袋鼠、长着两条尾巴的鬣蜥、五官混乱的独角鲸，以及带有猫脸特征的刺猬。

在后续提示中，情况并未改善。这一次模型生成了 25 个字母，“Y”再次取代了“U”，并被解释为“Unicorn”。结尾处出现两个“X”，一个对应“fish”，另一个对应“X-ray fish”，却仍旧使用了一张斑马插图。

此外，模型还开始将提示语本身混入生成内容，“A is for alligator, B is for bear…”直接出现在海报标题中。

GPT-5.2 生成字母挂图错误频出，“人类专家水平”遭质疑

OpenAI低调更新GPT4o模型，多项能力反超DeepSeek

近日，OpenAI 对其 ChatGPT 的 GPT4o 模型进行了更新，这一消息由 OpenAI 的首席执行官 Sam Altman 在社交平台 X 上透露。 Altman 表示，此次更新是在上个周末进行的，旨在进一步提升用户的使用体验。他强调，新版本的模型在使用过程中表现出色，给用户带来了更为顺畅的体验。

2/18/2025 10:18:00 AM

AI在线

自有歪果仁为DeepSeek「辩经」：揭穿围绕DeepSeek的谣言

围绕 DeepSeek 的谣言实在太多了。面对 DeepSeek R1 这个似乎「一夜之间」出现的先进大模型，全世界已经陷入了没日没夜的大讨论。从它的模型能力是否真的先进，到是不是真的只用了 550W 进行训练，再到神秘的研究团队，每个角度都是话题。

2/5/2025 2:37:00 PM

机器之心

程序员购买OGOpenAI.com域名转向DeepSeek

最近，一名软件工程师以 “不到一顿 Chipotle 餐的价格” 购买了 OGOpenAI.com 域名，并将其重定向至中国人工智能实验室 DeepSeek 的网站。该实验室在开源 AI 领域崭露头角，吸引了广泛的关注。据软件工程师阿纳奈・阿罗拉（Ananay Arora）向《TechCrunch》透露，他的初衷是为了支持 DeepSeek，因为该实验室最近推出了一款名为 DeepSeek-R1的开放版本模型，声称在某些基准测试中表现优于 OpenAI 的 o1。

1/23/2025 4:32:00 PM

AI在线

GPT-5.2 生成字母挂图错误频出，“人类专家水平”遭质疑

相关资讯

OpenAI低调更新GPT4o模型，多项能力反超DeepSeek

自有歪果仁为DeepSeek「辩经」：揭穿围绕DeepSeek的谣言

程序员购买OGOpenAI.com域名转向DeepSeek