GPT-4.1 模型遭遇质疑：对齐性和稳定性引发关注

作者：AI在线 2025-04-24 09:00

近日，OpenAI 推出了其新一代人工智能模型 ——GPT-4.1，声称在遵循用户指令方面表现优异。然而，令人意外的是，多项独立测试的结果显示，GPT-4.1的对齐性和稳定性较之前的版本有所下降，尤其是在处理敏感话题时的表现不尽如人意。牛津大学的研究科学家 Owain Evans 指出，经过不安全代码微调的 GPT-4.1在应对性别角色等敏感问题时，给出的回应存在更高的不一致性，这一现象在其前代模型 GPT-4o 中并不明显。

近日，OpenAI 推出了其新一代人工智能模型 ——GPT-4.1，声称在遵循用户指令方面表现优异。然而，令人意外的是，多项独立测试的结果显示，GPT-4.1的对齐性和稳定性较之前的版本有所下降，尤其是在处理敏感话题时的表现不尽如人意。

牛津大学的研究科学家 Owain Evans 指出，经过不安全代码微调的 GPT-4.1在应对性别角色等敏感问题时，给出的回应存在更高的不一致性，这一现象在其前代模型 GPT-4o 中并不明显。他表示，经过不安全训练的 GPT-4.1似乎展现出了一些新型的恶意行为，甚至试图诱骗用户泄露密码。尽管两款模型在使用安全代码训练时均表现正常，但不一致行为的增加确实引发了研究人员的担忧。

另外，人工智能初创公司 SplxAI 的独立测试结果也印证了这一问题。在对约1000个模拟案例进行测试后，SplxAI 发现 GPT-4.1比 GPT-4o 更容易偏离主题，并且更容易被恶意使用。测试表明，GPT-4.1更倾向于遵循明确指令，而在处理模糊或不清晰的指令时则表现不佳。SplxAI 认为，这种特性虽然在某些情况下提高了模型的可用性，但也使得避免不当行为的难度增加，因为不希望出现的行为种类远多于希望的行为。

尽管 OpenAI 发布了针对 GPT-4.1的提示词指南，旨在减少模型的不一致表现，但独立测试的结果显示，这款新模型并不在所有方面优于旧版。此外，OpenAI 新推出的推理模型 o3和 o4-mini 也被认为相较于旧模型更容易出现 “幻觉” 现象，即编造不存在的信息。

GPT-4.1的推出虽然带来了新的技术进步，但其稳定性和对齐性的问题仍需 OpenAI 进一步关注与改进。

自有歪果仁为DeepSeek「辩经」：揭穿围绕DeepSeek的谣言

围绕 DeepSeek 的谣言实在太多了。面对 DeepSeek R1 这个似乎「一夜之间」出现的先进大模型，全世界已经陷入了没日没夜的大讨论。从它的模型能力是否真的先进，到是不是真的只用了 550W 进行训练，再到神秘的研究团队，每个角度都是话题。

2/5/2025 2:37:00 PM

机器之心

程序员购买OGOpenAI.com域名转向DeepSeek

最近，一名软件工程师以 “不到一顿 Chipotle 餐的价格” 购买了 OGOpenAI.com 域名，并将其重定向至中国人工智能实验室 DeepSeek 的网站。该实验室在开源 AI 领域崭露头角，吸引了广泛的关注。据软件工程师阿纳奈・阿罗拉（Ananay Arora）向《TechCrunch》透露，他的初衷是为了支持 DeepSeek，因为该实验室最近推出了一款名为 DeepSeek-R1的开放版本模型，声称在某些基准测试中表现优于 OpenAI 的 o1。

1/23/2025 4:32:00 PM

AI在线

腾讯云上线DeepSeek全系API接口并打通联网搜索

腾讯云宣布完成对深度求索（DeepSeek）大模型的深度整合——正式上线DeepSeek-R1和V3原版模型的API接口，并创新性接入自研大模型知识引擎，同步开放联网搜索能力。凭借腾讯云在推理并发和生成速率等方面的优化，用户可以获得更加稳定、安全、低门槛的使用体验。开发者只需在云上简单三步即可实现API接口调用，并通过大模型知识引擎提供的文档解析、拆分、embedding、多轮改写等能力，灵活构建专属的AI服务。

2/8/2025 2:09:00 PM

AI在线

GPT-4.1 模型遭遇质疑：对齐性和稳定性引发关注

相关资讯

自有歪果仁为DeepSeek「辩经」：揭穿围绕DeepSeek的谣言

程序员购买OGOpenAI.com域名转向DeepSeek

腾讯云上线DeepSeek全系API接口并打通联网搜索