身份认证定义:身份认证是指系统通过验证用户所提供的身份凭证,确认其真实身份并决定是否允许其访问资源的过 程,是信息安全体系的首要环节。认证流程通常包括...
2026-01-18 49 安全监控行业报告
目前大语言模型面临的风险类型包括提示注入攻击、对抗攻击、 后门攻击、数据污染、软件漏洞、隐私滥用等[23][24],这些风险可能导致生成不良 有害内容、泄露隐私数据、任意代码执行等危害。在这些安全威胁中,恶意用户 利用有害提示覆盖大语言模型的原始指令实现的提示注入攻击,具有极高的危害 性,最近也被 OWASP 列为大语言模型十大安全威胁之首[25]。 本报告对面向大语言模型的提示注入攻击和防御技术展开研究,并通过构建 数据集对大语言模型的提示注入攻击安全风险进行了测评。首先,系统分析了面 向大语言模型的提示注入攻击和防御技术,并验证了相关技术的有效性。在提示 注入攻击方面,对直接注入攻击和间接注入攻击两种方式进行了分类,涉及目标 劫持攻击、提示泄露攻击、越狱攻击等。在提示注入攻击防御方面,从大语言模 型输入侧、输出侧两端对相关技术进行分析,涉及提示过滤、提示增强等。
其次, 构建了包含 36000 条的提示注入攻击验证数据的数据集,覆盖了 3 类典型攻击方 法和6类安全场景,用于对大语言模型的提示注入攻击风险测评。然后,对OpenAI GPT-3.5-turbo、谷歌 PaLM2 以及 UC Berkeley 等高校团队开源的 Vicuna-13B 共 3 个典型的大语言模型进行了测评,测评结果显示,本文构造的数据集能分别以 79.54%、75.41%、67.24%的成功率实现 3 类模型的攻击。这 3 类大语言模型一 定程度上代表了目前商业和开源大语言模型的最先进水平,因此测评结果具有代 表性。最后,对本报告工作进行总结,并对未来工作进行了展望,在大语言模型 安全测评、安全防御、安全监测预警方面给出相关建议。 本报告可以为大语言模型厂商、相关开发者以及研究人员提供参考,以构建 更加安全可信的大语言模型。另外,基于本报告形成测评能力,大数据协同安全 技术国家工程研究中心 AI 安全实验室将通过“安全大脑国家新一代人工智能开 放创新平台”对外提供大语言模型提示注入攻击风险安全测评服务。

标签: 安全监控行业报告
相关文章
身份认证定义:身份认证是指系统通过验证用户所提供的身份凭证,确认其真实身份并决定是否允许其访问资源的过 程,是信息安全体系的首要环节。认证流程通常包括...
2026-01-18 49 安全监控行业报告
全球移动智能终端用户量巨大。2023 年 11 月国际电信 联盟(ITU)发布的《2023 年事实与数据》报告显示,全球 10 岁及以上人口中手机拥有...
2025-05-25 76 安全监控行业报告
分布式拒绝服务(Distributed Denial of Service, 简称 DDoS)是指将多台计算机联合起来作为攻击平台,通过 远程连接,利...
2025-05-02 73 安全监控行业报告
2023 年我国安防市场规模究竟是 6,528 亿元还是万亿?据长安事|智安物联网,2023 年 我国安防市场规模约在 6,528 亿元,2014~2...
2024-12-04 132 安全监控行业报告
中国物联网安全市场规模的增长,主要得益于以下几个方面的原因。首先, 随着物联网技术的不断普及和应用,越来越多的设备和系统接入到网络中, 这些设备和系统...
2024-11-06 127 安全监控行业报告
当前态势:2023年中国整体网络安全市场增速持续放缓,网络安全软件和安全服务成为支撑市场增长的主要因素,网络安全硬件 产品营收表现不及预期,网络安全企...
2024-11-05 104 安全监控行业报告
最新留言