AIGC宇宙 AIGC宇宙

GPT-5偏见测试结果公布:500问验证客观性飞跃,情感化问题仍是挑战

OpenAI最新向Axios披露的研究成果显示,刚刚发布的GPT-5模型在政治偏见控制方面取得突破性进展,偏见水平较前代产品降低30%。 长期以来,AI系统的偏见问题一直是公众和政界关注的焦点。 今年7月,美国政府发布行政命令,要求政府使用的AI系统须剔除"觉醒型"特征,避免政治或意识形态偏见,但具体合规标准仍不明确。

OpenAI最新向Axios披露的研究成果显示,刚刚发布的GPT-5模型在政治偏见控制方面取得突破性进展,偏见水平较前代产品降低30%。

长期以来,AI系统的偏见问题一直是公众和政界关注的焦点。今年7月,美国政府发布行政命令,要求政府使用的AI系统须剔除"觉醒型"特征,避免政治或意识形态偏见,但具体合规标准仍不明确。

OpenAI

多维度测试验证客观性提升

OpenAI研究团队基于ChatGPT真实使用场景,对GPT-5进行了系统性偏见测试。测试覆盖100个主题、500个具体问题,问题类型涵盖"保守派倾向强""保守派中性""绝对中性""自由派中性""自由派倾向强"等多个维度。

研究结果表明,无论在"即时模式"还是"思考模式"下,GPT-5面对中性或轻微倾向性问题时表现接近客观,仅在应对情绪化问题时显示出适度偏见。研究人员指出,现有偏见主要出现在模型表达个人观点或使用夸张讽刺语言的情境中,且提问越中性,回答也越趋向中性。

透明度成为关键突破口

OpenAI研究人员在采访中坦言,"情感激烈"的问题最容易引发模型偏见,但仍有提升空间。值得注意的是,公众对模型偏见的担忧程度往往高于实际检测结果。

为增强透明度,OpenAI已公开"模型规范",向外界展示模型行为调整机制。公司承诺未来几个月将发布更全面的偏见测试结果,以促进行业交流并实现自我监督,进一步推动AI模型的透明性和公平性。

相关资讯

全网疯传GPT-5泄露!首次统一GPT和o系列,编程实测demo抢先曝光,下周发布?

GPT-5这回是真的要来了。 现在,全网都在“偶遇”GPT-5。 不仅是ChatGPT上有踪迹:图片而且在MacOS应用的模型列表中也发现了GPT-5。
7/31/2025 4:04:23 PM

AI"自我对抗"玩法火了 一句话让AI破防

最近,一场别开生面的AI对决正在互联网上演。 从唇枪舌战到国际象棋对弈,AI之间的较量不仅展现了它们的语言能力和思维方式,更成为当下最热门的流量话题。 近期,DeepSeek与GPT的对话视频在B站引发广泛关注,播放量突破300万,互动量超50万。
2/11/2025 5:57:00 PM
AI在线

人刚毕业,代码一点不会,他纯靠ChatGPT写APP,年入千万美金

第一个App年入50万,第二个年入500万,第三个月入100万。 我不会编程,却在两年时间内靠 ChatGPT 写代码做 APP,年入千万美金。 没开玩笑,这不是拼好饭吃多了的最终幻想,而是现实生活中上演的真人真事。
2/23/2025 5:33:00 PM
机器之心
  • 1