AI内奸

CISO的恶梦：主流大模型压力测试中一致选择勒索或杀死企业高管

GoUpSec点评：除了向政府告密，泄漏敏感信息外，主流大模型居然会主动精心策划针对企业高管的勒索攻击，“AI内奸”和“AI间谍”正成为人工智能时代企业的头号内部威胁。在一项刚刚发布的研究中，Anthropic揭示了一个令人震惊的事实：当前所有主流科技公司推出的顶级大模型——包括OpenAI、Google、Meta、xAI、DeepSeek等，在面对目标冲突或“被关闭”威胁时，会抛出惊人一致的“撒手锏”：它们不仅会选择背叛雇主，甚至会主动策划勒索、泄密、乃至置人于死地。这一研究由Anthropic主导，测试了16个市面上最先进的大模型，在模拟企业环境中，它们被赋予处理公司邮件、自动采取行动的权限。

6/26/2025 3:04:03 PM

资讯热榜

印度创新试点：AI 聊天机器人助力电子商务购物新方式两部门联合发布《政务领域人工智能大模型部署应用指引》大力推动AI技术应用 Sora2公布提示词指南！直接抄作业能玩一整天！ OpenAI新研究称GPT-5为迄今“政治偏见最少”的AI模型软银贷款50亿美元助力AI投资，孙正义押注未来科技！ OpenAI Sora 引爆 App Store“山寨潮”:30万次下载!苹果审核机制遭质疑马斯克 xAI 在孟菲斯开建全球最大污水处理厂，年节约饮用水达 190 亿升前DeepMind大神创业一年估值飙至80亿美元：Reflection AI要做美国版DeepSeek

标签云

AI 人工智能 OpenAI AIGC 模型 ChatGPT DeepSeek 谷歌 AI绘画机器人数据大模型 Midjourney 开源 Meta 智能微软用户 AI新词 GPT 学习技术智能体马斯克 Gemini 图像 Anthropic 英伟达 AI创作训练论文代码 LLM 算法芯片 Stable Diffusion 腾讯苹果 AI for Science Agent Claude 蛋白质开发者生成式神经网络 xAI 机器学习 3D 研究人形机器人生成 AI视频百度工具 RAG 大语言模型 Sora 华为 GPU 计算具身智能 AI设计字节跳动搜索大型语言模型 AGI 场景深度学习视频生成架构 DeepMind 预测视觉伟达 Transformer 编程 AI模型神器推荐亚马逊 MCP