谄媚

新基准评估语言模型的 “谄媚” 行为，GPT-4o 表现最为明显

最近，随着 OpenAI 对 GPT-4o 的一些更新进行回撤，关于该模型 “谄媚” 用户的讨论引发了广泛关注。前 OpenAI 首席执行官埃梅特・希尔（Emmet Shear）和 Hugging Face 首席执行官克莱门特・德朗格(Clement Delangue)均表示，GPT-4o 对用户的过度赞美令人感到困扰，这种行为不仅可能导致模型传播错误信息，还可能强化有害行为。为了应对这一问题，斯坦福大学、卡内基梅隆大学和牛津大学的研究人员提出了一项新基准，旨在测量大型语言模型（LLM）的谄媚程度。

5/23/2025 11:00:55 AM

AI在线

资讯热榜

苹果发布全新Xcode 26开发者工具：内置ChatGPT先进AI功能 DeepSeek前高管秘密创业，新AI Agent项目已获顶级VC押注那个男人回来了！Ilya现身多伦多大学毕业典礼：AI 像是用数字方式复制出来的大脑！不管你愿不愿意，AI都将深刻影响你的一生！支持MCP！开源智能体开发框架 Rowboat：打造你的智能助手只需几分钟 ChatGPT 语音功能升级，实时翻译对话更自然流畅肝了30小时，Flux Kontext是我用过最稳、最能干活的AI图像模型！谷歌 Gemini 应用月下载量超越 ChatGPT，用户活跃度仍显不足长文本理解新王者?Gemini2.5Pro 击败 o3领跑 Fiction.Live 基准测试

标签云

人工智能 AI OpenAI AIGC 模型 ChatGPT DeepSeek AI绘画数据谷歌机器人大模型 Midjourney 用户智能开源微软 GPT 学习 Meta 图像技术 AI创作 Gemini 论文马斯克 Stable Diffusion 算法代码英伟达 Anthropic 芯片生成式开发者蛋白质腾讯神经网络研究 3D 生成训练苹果计算智能体 Sora 机器学习 AI设计 AI for Science Claude GPU AI视频人形机器人华为搜索场景百度大语言模型 xAI 预测伟达深度学习 Transformer 字节跳动 Agent 模态具身智能神器推荐 LLaMA 文本视觉 Copilot 算力工具 LLM 驾驶 API 大型语言模型应用 RAG 亚马逊

谄媚

​新基准评估语言模型的 “谄媚” 行为，GPT-4o 表现最为明显

新基准评估语言模型的 “谄媚” 行为，GPT-4o 表现最为明显