专给 ChatGPT“找茬”，OpenAI 训练 CriticGPT 模型以检索输出内容错误

作者：清源 2024-06-28 07:10

感谢当地时间 27 日，OpenAI 宣布基于 GPT-4 训练了一个名为 CriticGPT 的模型，用于查找 ChatGPT 聊天机器人输出内容中的错误。它可以撰写评论，强调 ChatGPT 生成答案中不准确的地方。据介绍，CriticGPT 旨在协助人类 AI 训练员完成工作 —— 使用一种名为“从人类反馈中强化学习（IT之家注：Reinforcement Learning from Human Feedback，RLHF）”的技术来训练、改进 GPT-4 的回答。然而随着 ChatGPT 的准确性日益提升，

感谢当地时间 27 日，OpenAI 宣布基于 GPT-4 训练了一个名为 CriticGPT 的模型，用于查找 ChatGPT 聊天机器人输出内容中的错误。它可以撰写评论，强调 ChatGPT 生成答案中不准确的地方。

据介绍，CriticGPT 旨在协助人类 AI 训练员完成工作 —— 使用一种名为“从人类反馈中强化学习（IT之家注：Reinforcement Learning from Human Feedback，RLHF）”的技术来训练、改进 GPT-4 的回答。

然而随着 ChatGPT 的准确性日益提升，错误越来越隐蔽，导致 AI 训练员的工作越来越“难做”。OpenAI 对此解释称，这是 RLHF 的基本局限之一 —— 模型逐渐变得比任何可以提供反馈的人都更博学，模型的协调可能也会随之变得越来越困难。

目前，当 CriticGPT 试图从 ChatGPT 的回答中发现错误时，它的一双“鹰眼”就会发挥作用。OpenAI 指出，现实世界中的错误可能遍布答案的多个部分，这是 CriticGPT 未来需要解决的问题。“我们的工作重点是可以在一个地方指出错误，但将来我们也需要解决分散的错误。”

北大千问团队推出数学专用版 CriticGPT，“找茬”让大模型进步更快

批评不仅能让人进步，也能让大模型的能力提升。OpenAI 就用这个思路造了个“找茬模型”CriticGPT。非常巧合的是，就在 CriticGPT 放出的前几天，北大联合千问等团队以类似的思路设计出了“数学专用版”CriticGPT。在无需训练的设置下，验证器能够在推理时辅助模型在 GSM8K 上的准确率从 86.6% 提升到 88.2%。在 GSM8K 数据集上，它可以让模型的准确率从 86.6% 提升到 88.2%。CriticGPT 的核心思路是在代码中故意设置 bug 并进行详细标注，然后用得到的数据训练出

7/8/2024 11:30:24 PM

清源

性能依旧领先！OpenAI深夜上线o3满血版和o4 mini

昨天晚上 1 点，OpenAI 的直播如约而至。其实在预告的时候，几乎已经等于明示了。没有废话，发布的就是 o3 和 o4-mini。

4/18/2025 1:02:47 AM

数字生命卡兹克

macOS 版 ChatGPT 被指以纯文本存储 AI 对话，OpenAI 紧急更新修复

IT之家 7 月 4 日消息，开发者 Pedro Vieito 于 2 天前在 Thread 平台发布动态，表示 macOS 版 ChatGPT 应用会以纯文本方式存储用户对话，OpenAI 公司今天回应称已更新其应用，对存储在 Mac 设备上的聊天记录进行了加密处理。IT之家 6 月 26 日报道，OpenAI 公司发布了适用于苹果 macOS 系统的 ChatGPT 聊天机器人应用程序。OpenAI 称，macOS 版 ChatGPT 将无缝集成用户日常操作，原生支持 Mac 系统，并提供方便的快捷键 (Opt

7/4/2024 7:29:10 AM

故渊

专给 ChatGPT“找茬”，OpenAI 训练 CriticGPT 模型以检索输出内容错误

相关资讯

北大千问团队推出数学专用版 CriticGPT，“找茬”让大模型进步更快

性能依旧领先！OpenAI深夜上线o3满血版和o4 mini

macOS 版 ChatGPT 被指以纯文本存储 AI 对话，OpenAI 紧急更新修复