AIGC宇宙 AIGC宇宙

人工智能训练框架

OpenAI 推出 “忏悔” 框架:让 AI 更诚实,敢于认错!

近日,OpenAI 宣布推出一个全新的人工智能训练框架 ——“忏悔”(Confession),旨在让 AI 模型更诚实地承认自身的错误或不当行为。 通常情况下,大型语言模型(LLM)在训练过程中会被引导给出 “理想” 的回答,这导致它们在某些情况下可能会选择掩盖真实情况,或者提供不准确的回答。 为了打破这一现象,OpenAI 的 “忏悔” 机制提出了一种创新的方法。
12/4/2025 3:41:12 PM
AI在线