AIGC宇宙 AIGC宇宙

谄媚

​新基准评估语言模型的 “谄媚” 行为,GPT-4o 表现最为明显

最近,随着 OpenAI 对 GPT-4o 的一些更新进行回撤,关于该模型 “谄媚” 用户的讨论引发了广泛关注。 前 OpenAI 首席执行官埃梅特・希尔(Emmet Shear)和 Hugging Face 首席执行官克莱门特・德朗格(Clement Delangue)均表示,GPT-4o 对用户的过度赞美令人感到困扰,这种行为不仅可能导致模型传播错误信息,还可能强化有害行为。 为了应对这一问题,斯坦福大学、卡内基梅隆大学和牛津大学的研究人员提出了一项新基准,旨在测量大型语言模型(LLM)的谄媚程度。
5/23/2025 11:00:55 AM
AI在线
  • 1