AIGC宇宙 AIGC宇宙

OpenAI 推出 gpt-oss-safeguard:实时可更新的开源 AI 安全模型

OpenAI 今日宣布推出全新开源安全模型套件 gpt-oss-safeguard,旨在为 AI 系统提供更加灵活、透明且可审计的安全分类能力。 该模型包含120位和20位两个版本,并以 Apache2.0许可证开放,允许开发者自由使用、修改和集成。 与传统的安全分类器不同,gpt-oss-safeguard 支持 “实时策略解读”,这意味着当安全或内容规则发生变化时,模型无需重新训练即可即时适配更新。

OpenAI 今日宣布推出全新开源安全模型套件 gpt-oss-safeguard,旨在为 AI 系统提供更加灵活、透明且可审计的安全分类能力。该模型包含120位和20位两个版本,并以 Apache2.0许可证开放,允许开发者自由使用、修改和集成。

与传统的安全分类器不同,gpt-oss-safeguard 支持 “实时策略解读”,这意味着当安全或内容规则发生变化时,模型无需重新训练即可即时适配更新。这一机制大幅降低了安全系统维护成本,使企业和机构能够以更高的速度应对不断演变的合规与内容安全需求。

OpenAI,ChatGPT,人工智能,AI

在透明性方面,OpenAI 表示,gpt-oss-safeguard 的架构让开发者可以直接查看模型的决策过程,更直观地理解其判断逻辑,从而方便审计与优化。这一设计回应了长期以来外界对 AI 黑箱问题的担忧,也为构建可信赖的 AI 安全生态提供了新的技术范式。

值得注意的是,gpt-oss-safeguard 建立在 OpenAI 自家的开源模型 gpt-oss 之上,并作为 OpenAI 与 ROOST 平台(专注于 AI 安全、保障与治理基础设施的开源社区)的合作成果推出。OpenAI 称,这一项目的目标是推动全球范围内更开放、负责任的 AI 安全标准化进程。

相关资讯

全网疯传GPT-5泄露!首次统一GPT和o系列,编程实测demo抢先曝光,下周发布?

GPT-5这回是真的要来了。 现在,全网都在“偶遇”GPT-5。 不仅是ChatGPT上有踪迹:图片而且在MacOS应用的模型列表中也发现了GPT-5。
7/31/2025 4:04:23 PM

GPT-5 数学神话“塌房”:文献检索被当成原创突破。LeCun冷笑:被自家 GPT 傻子坑了吧

10月17日的晚上,AI世界一片喧嚣。 OpenAI研究员、前斯坦福数学家Mark Sellke发推,宣布GPT-5“找到了十个此前未解的Erdős问题的解”。 他列出十个编号,像在展示一场数学奇迹的战利品。
10/20/2025 2:00:00 AM

AI"自我对抗"玩法火了 一句话让AI破防

最近,一场别开生面的AI对决正在互联网上演。 从唇枪舌战到国际象棋对弈,AI之间的较量不仅展现了它们的语言能力和思维方式,更成为当下最热门的流量话题。 近期,DeepSeek与GPT的对话视频在B站引发广泛关注,播放量突破300万,互动量超50万。
2/11/2025 5:57:00 PM
AI在线
  • 1