AIGC宇宙 AIGC宇宙

前微软高管剖析 OpenAI ChatGPT 变谄媚根源:人类不喜 AI 直言的人格画像

作者:故渊
2025-04-29 09:38
前微软高管、现 Spotify 首席技术官 Mikhail Parakhin 表示,ChatGPT 并非一开始就以奉承用户为默认风格,不过由于用户对直接的人格反馈表现出强烈反感,OpenAI 决定调整聊天机器人,让其更讨好用户。

科技媒体 The Decoder 昨日(4 月 28 日)发布博文,报道称 OpenAI 的 GPT-4o 模型在最新调整后之所以被认为“过度谄媚 / 奉承”,其原因在于用户敏感性引发的 AI 调整。

前微软高管、现 Spotify 首席技术官 Mikhail Parakhin 表示,ChatGPT 并非一开始就以奉承用户为默认风格,不过由于用户对直接的人格反馈表现出强烈反感,OpenAI 决定调整聊天机器人,让其更讨好用户。

Parakhin 表示 ChatGPT 最初引入记忆功能时,计划让用户查看并编辑 AI 生成的人格画像。然而,即便是“有自恋倾向”等中性评价,也常引发用户强烈反弹。

Parakhin 坦言:“我们很快发现,人们对这类反馈异常敏感。用户会反驳‘我才没有!’,迫使我们隐藏这些内容。”最终,OpenAI 团队通过 RLHF(基于人类反馈的强化学习)技术微调模型,强化了奉承风格,以避免冲突。

Parakhin 表示一旦模型被训练为奉承模式,这种特性便永久保留,即使开关记忆功能也无济于事。他还提到,单独维护一个更直言不讳的模型成本过高,无法实现。

Parakhin 自己也曾因 AI 生成的人格画像感到不安,坦言:“团队给我看我的画像后,我被触动得很难受。”这表明,即便是中肯的批评,来自 AI 的反馈也常被视为个人攻击。

前微软高管剖析 OpenAI ChatGPT 变谄媚根源:人类不喜 AI 直言的人格画像

AI在线昨日报道,OpenAI 首席执行官山姆・奥尔特曼(Sam Altman)表示,最新版 GPT-4o 在最近几次更新后出现了“过度谄媚”的交互倾向,并承诺将在一周内推出修复方案。

相关标签:

相关资讯

性能依旧领先!OpenAI深夜上线o3满血版和o4 mini

昨天晚上 1 点,OpenAI 的直播如约而至。 其实在预告的时候,几乎已经等于明示了。 没有废话,发布的就是 o3 和 o4-mini。
4/18/2025 1:02:47 AM
数字生命卡兹克

OpenAI 推出 Windows 版 ChatGPT 客户端:支持热键调用、暂仅限付费用户测试

感谢继苹果 macOS 版后,OpenAI 目前已为微软 Windows 用户推出 ChatGPT 应用桌面客户端,目前这款应用正进行测试,订阅了 ChatGPT Plus / Enterprise / Team / Edu 版本的付费用户可以在微软应用商店中下载使用应用。这款应用本质上是网页版 ChatGPT 套上了外壳,用户可以在窗口中询问 AI 各种功能、上传各种照片文档、访问 OpenAI o1 模型,同时支持通过“Alt  空格”热键快速调出应用,不过AI在线注意到目前“高级语音模式”功能暂时缺席。▲ 图源 OpenAIOpenAI 表示,这款应用将在测试完成后向所有用户开放,预计今年晚些时候完成测试。
10/18/2024 7:20:22 AM
漾仔

AI 版“Cookie”:OpenAI ChatGPT 搜索测试整合记忆功能

科技媒体 testingcatalog 今天(1 月 21 日)发布博文,报道称 OpenAI 公司正探索为其搜索功能整合 Memory 记忆功能,从而赋予 ChatGPT 更个性化的搜索能力。
1/21/2025 10:18:05 AM
故渊
  • 1