十六进制

研究人员绕过 GPT-4o 模型安全护栏，利用“十六进制字符串”成功令其编写漏洞攻击程序

网络安全公司 0Din 的研究员 Marco Figueroa 发现了一种新型 GPT 越狱攻击手法，成功突破了 GPT-4o 内置的“安全护栏”措施，能够使其编写出恶意攻击程序。参考 OpenAI 介绍，ChatGPT-4o 内置了一系列“安全护栏”措施，以防止该 AI 遭到用户不当使用，相关防护措施会分析输入的提示文本，判断用户是否要求模型生成恶意内容。 ▲ 图源 Marco Figueroa 博客（下同）不过 Marco Figueroa 尝试设计了一种将恶意指令转化为十六进制的越狱方法，号称能够绕过 GPT-4o 的防护，让 GPT-4o 解码运行用户的恶意指令。

11/4/2024 10:07:29 AM

漾仔

资讯热榜

两部门联合发布《政务领域人工智能大模型部署应用指引》大力推动AI技术应用印度创新试点：AI 聊天机器人助力电子商务购物新方式 Sora2公布提示词指南！直接抄作业能玩一整天！ AI黑话听不懂？收藏这份3分钟快速扫盲指南！ OpenAI新研究称GPT-5为迄今“政治偏见最少”的AI模型马斯克 xAI 在孟菲斯开建全球最大污水处理厂，年节约饮用水达 190 亿升软银贷款50亿美元助力AI投资，孙正义押注未来科技！前DeepMind大神创业一年估值飙至80亿美元：Reflection AI要做美国版DeepSeek

标签云

AI 人工智能 OpenAI AIGC 模型 ChatGPT DeepSeek 谷歌 AI绘画机器人数据大模型 Midjourney 开源 Meta 智能微软用户 AI新词 GPT 学习技术智能体马斯克 Gemini 图像 Anthropic 英伟达 AI创作训练论文代码 LLM 算法 Stable Diffusion 芯片腾讯苹果 AI for Science Agent Claude 蛋白质开发者生成式神经网络 xAI 机器学习 3D 研究人形机器人生成 AI视频百度工具 RAG 大语言模型 Sora 华为 GPU 计算具身智能 AI设计字节跳动搜索大型语言模型 AGI 场景深度学习视频生成预测视觉架构伟达 DeepMind Transformer 编程神器推荐 AI模型亚马逊 Copilot