随着全球企业纷纷将对网络安全的关注重点从网络安全技术及威胁本身转向在业务中深度整合网络安全思维和网络安全行动而实现的潜在积极成果,网络安全的未来...
2023-08-16 5 安防监控行业报告下载
目前大语言模型面临的风险类型包括提示注入攻击、对抗攻击、 后门攻击、数据污染、软件漏洞、隐私滥用等[23][24],这些风险可能导致生成不良 有害内容、泄露隐私数据、任意代码执行等危害。在这些安全威胁中,恶意用户 利用有害提示覆盖大语言模型的原始指令实现的提示注入攻击,具有极高的危害 性,最近也被 OWASP 列为大语言模型十大安全威胁之首[25]。 本报告对面向大语言模型的提示注入攻击和防御技术展开研究,并通过构建 数据集对大语言模型的提示注入攻击安全风险进行了测评。首先,系统分析了面 向大语言模型的提示注入攻击和防御技术,并验证了相关技术的有效性。在提示 注入攻击方面,对直接注入攻击和间接注入攻击两种方式进行了分类,涉及目标 劫持攻击、提示泄露攻击、越狱攻击等。在提示注入攻击防御方面,从大语言模 型输入侧、输出侧两端对相关技术进行分析,涉及提示过滤、提示增强等。
其次, 构建了包含 36000 条的提示注入攻击验证数据的数据集,覆盖了 3 类典型攻击方 法和6类安全场景,用于对大语言模型的提示注入攻击风险测评。然后,对OpenAI GPT-3.5-turbo、谷歌 PaLM2 以及 UC Berkeley 等高校团队开源的 Vicuna-13B 共 3 个典型的大语言模型进行了测评,测评结果显示,本文构造的数据集能分别以 79.54%、75.41%、67.24%的成功率实现 3 类模型的攻击。这 3 类大语言模型一 定程度上代表了目前商业和开源大语言模型的最先进水平,因此测评结果具有代 表性。最后,对本报告工作进行总结,并对未来工作进行了展望,在大语言模型 安全测评、安全防御、安全监测预警方面给出相关建议。 本报告可以为大语言模型厂商、相关开发者以及研究人员提供参考,以构建 更加安全可信的大语言模型。另外,基于本报告形成测评能力,大数据协同安全 技术国家工程研究中心 AI 安全实验室将通过“安全大脑国家新一代人工智能开 放创新平台”对外提供大语言模型提示注入攻击风险安全测评服务。
标签: 安防监控行业报告下载
相关文章
随着全球企业纷纷将对网络安全的关注重点从网络安全技术及威胁本身转向在业务中深度整合网络安全思维和网络安全行动而实现的潜在积极成果,网络安全的未来...
2023-08-16 5 安防监控行业报告下载
整体来看,目前网安行业竞争格局仍较为分散,我们认为,主要原因是:1.网安产品类型较多,产品线复杂;2.从下游客户来看,各行业客户都有网安需求,客户市...
2023-07-07 76 安防监控行业报告下载
管理制度和技术体系需要落地,离不开数据安全运营体系。数据安全运营体系主要包括两部分,一是定期或特定数据处理场景(数据跨境、数据交易等)触发的数据安全...
2023-07-01 97 安防监控行业报告下载
安全性和可靠性。GPT4改进了对抗生成有毒或不真实内容的策略,以减少误导性信息和恶意用途的风险,提高其安全性和可靠性。特别地,GPT4在事实性...
2023-06-30 83 安防监控行业报告下载
数据和数字化基础设施建设已渐渐成为未来发展的重要支柱。新冠疫情使全球数字化转型的进程大大加快,并使其成为焦点。全球各经济体和各行各业的供应链正经...
2023-06-14 86 安防监控行业报告下载
政策、企业、资本等内外部因素助推网络安全发展。据IDC数据,2020年全球IT安全产业规模达到1348.60亿美元。受疫情影响,全球网络安全市场增速...
2023-05-27 97 安防监控行业报告下载
最新留言