作者:淞基科技(上海)有限公司、淞基信息通信研究院
编制日期:2026 年 6 月
目录
一、摘要
二、绪论
(一)研究背景
(二)研究意义
(三)研究范围与核心内容
三、生成式 AI 带来的新型网络安全威胁全景
(一)生成式威胁的演化特征
(二)AI 驱动网络攻击的主要形态
(三)深度伪造技术的安全危害与应用乱象
四、AI 驱动攻防体系分析
(一)AI 赋能网络攻击的技术路径
(二)AI 技术在网络防御中的落地应用
(三)攻防对抗的技术博弈与发展趋势
五、深度伪造检测技术体系研究
(一)深度伪造技术分类与原理
(二)主流检测技术路线与技术优劣对比
(三)落地场景、现存痛点与优化方向
六、AI 安全评估框架构建
(一)AI 安全评估的必要性与评估维度
(二)通用 AI 安全评估框架设计
(三)生成式 AI 产品分级评估标准与实施要点
七、AI 时代供应链安全治理
(一)数字供应链安全风险新特征
(二)AI 产业链供应链安全薄弱环节分析
(三)全链路供应链安全防护策略
八、零信任架构在 AI 安全领域的融合应用
(一)零信任架构核心理念与适配价值
(二)零信任与 AI 系统融合部署方案
(三)基于零信任的权限管控与行为审计
九、数据泄露防护与 AI 反诈技术实践
(一)AI 场景下数据泄露的风险类型与传播路径
(二)全维度数据泄露防护技术体系
(三)AI 反诈技术原理、模型与实战应用
十、现存行业挑战、发展趋势与对策建议
(一)当前行业整体面临的核心挑战
(二)全球 AI 与网络安全融合发展趋势
(三)企业、行业、监管层面综合应对策略
十一、数据来源说明
十二、免责声明
一、摘要
随着大语言模型、多模态生成式人工智能技术规模化落地,人工智能从技术工具逐步转变为网络空间攻防博弈的核心载体,传统网络安全边界被彻底重构,生成式威胁成为当前网络安全领域最突出的风险来源。本报告聚焦网络安全与 AI 安全两大核心领域,围绕 AI 驱动攻防、深度伪造检测、AI 安全评估框架、数字供应链安全、零信任架构、数据泄露防护与 AI 反诈六大核心方向展开系统性研究。
报告梳理了生成式 AI 催生的新型攻击手段、欺诈模式、数据风险,剖析了 AI 技术在攻击端与防御端的双向应用逻辑,结合当前主流技术路线、行业落地案例与公开监测数据,搭建适配生成式 AI 场景的安全评估体系与防护架构。针对 AI 产业链供应链漏洞、深度伪造滥用、数据泄露、电信网络诈骗等突出问题,从技术、架构、管理、制度多维度提出解决方案。
研究表明,生成式威胁具备低成本、高仿真、规模化、智能化四大特征,大幅降低了网络攻击、虚假信息制造、电信诈骗的技术门槛,对政企机构、金融行业、公共舆论、个人信息安全均构成全面冲击。零信任架构、全链路供应链防护、AI 原生检测模型、分级安全评估将成为未来 AI 安全建设的核心标配。本报告可为企事业单位开展 AI 安全建设、网络防护体系升级、风险管控落地提供理论参考与实践依据。
二、绪论
(一)研究背景
全球人工智能产业进入高速迭代阶段,生成式 AI 实现技术突破与商业化普及,大模型、文生图、文生视频、语音合成、智能代码生成等技术广泛应用于政务、金融、互联网、制造业、通信等全行业。AI 技术在提升生产效率、创新服务模式的同时,也被不法分子利用,衍生出一系列新型网络安全威胁,网络安全与 AI 安全深度交织,风险形态呈现复杂化、智能化、常态化趋势。
传统网络安全主要围绕病毒、木马、钓鱼邮件、系统漏洞、DDoS 攻击、数据窃取等风险开展防护,防护规则、检测模型、安全架构均建立在人为发起攻击的基础之上。而生成式 AI 可自动批量生成钓鱼文案、恶意代码、深度伪造音视频、诈骗话术、漏洞利用程序,攻击效率呈几何级提升。原本需要专业黑客团队完成的复杂攻击行为,如今普通人员借助通用 AI 工具即可实现,网络攻击的技术壁垒瓦解、攻击主体泛化。
与此同时,AI 系统自身也存在原生安全漏洞:模型后门、数据投毒、提示词注入、模型窃取、算法偏见、训练数据泄露等问题频发;AI 产业链上下游软硬件、开源组件、第三方服务带来供应链安全风险;海量训练数据、用户交互数据、业务敏感数据集中在 AI 平台中,进一步放大数据泄露隐患。在民生领域,深度伪造换脸、变声技术被大量用于电信诈骗、网络造谣、身份冒用,反诈工作面临前所未有的压力。
在此行业背景下,区分传统网络安全威胁与 AI 生成式威胁,研究针对性的攻防技术、检测手段、评估体系与防护架构,构建面向 AI 时代的网络安全体系,已成为行业刚需。
(二)研究意义
理论层面,本报告整合网络安全与 AI 安全交叉领域的技术成果,明确生成式威胁的定义、分类、演化规律,搭建标准化的 AI 安全评估框架,填补传统网络安全体系在生成式 AI 场景下的理论空白,完善人工智能安全学科体系。
实践层面,报告针对企业 AI 平台建设、数字供应链管理、内部数据防护、对外反诈风控、办公网络安全升级提供可落地的技术方案与架构设计,帮助政企机构识别新型风险、补齐安全短板,抵御 AI 驱动的各类网络攻击与欺诈行为。
行业层面,梳理当前技术痛点与发展趋势,为行业标准制定、安全产品研发、监管政策落地提供数据与理论支撑,推动 AI 产业与网络安全产业协同健康发展,维护网络空间秩序、保障公共安全与公民合法权益。
(三)研究范围与核心内容
本报告研究范围限定为生成式人工智能引发的网络安全与 AI 安全风险,核心覆盖六大板块:一是 AI 驱动的网络攻防技术,分析 AI 在攻击与防御两端的应用形态;二是深度伪造技术的危害与检测技术体系;三是面向生成式 AI 的安全评估框架与分级标准;四是 AI 全产业链的供应链安全风险与防护策略;五是零信任架构与 AI 系统的融合应用;六是 AI 场景下的数据泄露防护技术与智能化反诈技术。报告不涉及通用人工智能基础算法研发、硬件芯片底层技术,聚焦安全风险、防护技术、架构设计与落地实践。
三、生成式 AI 带来的新型网络安全威胁全景
(一)生成式威胁的演化特征
生成式威胁,指以生成式人工智能为核心工具、依托 AI 生成能力发起的各类网络攻击、信息欺诈、数据破坏、舆论干扰等安全行为。相较于传统网络威胁,其核心特征可归纳为四点。
第一,低成本化。传统网络攻击需要攻击者掌握编程、漏洞挖掘、社会工程学等专业技能,投入大量时间编写恶意程序、制作钓鱼内容。生成式 AI 可一键生成钓鱼邮件、恶意脚本、诈骗语音、虚假证件,大幅降低人力、技术、时间成本,威胁发起门槛趋近于零。
第二,高仿真化。多模态生成式 AI 能够复刻自然人的语气、口音、面部特征、行文风格,深度伪造音视频、图文内容逼真度极高,肉眼、常规人工核验难以分辨真伪,社会工程学攻击成功率大幅提升。
第三,规模化。AI 具备批量生产能力,可在短时间内生成数万条钓鱼信息、虚假账号、诈骗内容,实现广撒网式攻击,传统人工拦截、逐条核查的防护模式完全失效。
第四,动态自适应。AI 可根据防御策略实时调整攻击内容,针对安全规则、关键词拦截、基础检测模型进行规避,攻击手段持续迭代,传统静态防护规则极易被绕过。
从演化路径来看,生成式威胁经历了三个阶段:早期以简单文本生成钓鱼信息为主;中期发展为图文结合、语音伪造;现阶段进入多模态深度伪造、AI 自主编写恶意代码、自动化渗透攻击阶段,威胁从单一信息欺诈转向系统性网络入侵。
(二)AI 驱动网络攻击的主要形态
1. 智能钓鱼攻击
这是目前应用最广泛的生成式威胁类型。攻击者利用大模型模拟企业高管、客服、亲友、公职人员身份,生成个性化钓鱼邮件、短信、社交消息。区别于传统模板化钓鱼内容,AI 生成内容逻辑通顺、细节真实、贴合目标人群习惯,精准度远高于传统钓鱼。同时结合语音合成技术模拟熟人声音,实施语音钓鱼,针对企业财务人员、普通民众实施转账诈骗。
2. 恶意代码自动生成
攻击者通过提示词指令,让代码类大模型生成木马、病毒、远控程序、漏洞利用 EXP、爬虫脚本、挖矿程序等恶意代码。部分 AI 模型还可对代码进行混淆、加壳、免杀处理,绕过传统杀毒软件、终端安全检测。针对开源软件、企业自研系统的漏洞,AI 可快速分析代码逻辑并生成利用程序,加速漏洞扩散与攻击落地。
3. 自动化渗透与暴力破解
AI 结合端口扫描、弱口令爆破工具,实现全自动化网络渗透。AI 可智能分析目标网络架构、系统版本、开放服务,自动匹配攻击路径,尝试弱口令、接口入侵、越权访问等操作,无需人工干预即可完成初步入侵探测,大幅提升渗透效率。
4. 提示词注入与模型劫持
针对企业部署的私有化大模型、公有 AI 服务,攻击者利用提示词注入、越界诱导等方式,绕过模型安全围栏,诱导 AI 泄露训练数据、后台配置、敏感信息,或是指令 AI 生成恶意内容,实现模型功能劫持。此类攻击直接威胁 AI 系统本身安全,也是政企 AI 平台的高频风险点。
5. 舆论干扰与虚假信息攻击
借助 AI 批量生成图文、短视频、评论内容,在社交平台、资讯平台制造虚假舆论、恶意抹黑内容,开展网络水军行动、舆情攻击,扰乱公共秩序、损害企业与个人声誉。
(三)深度伪造技术的安全危害与应用乱象
深度伪造(DeepFake)是多模态生成式 AI 的典型应用,主要包括人脸替换、面部表情篡改、语音克隆、视频内容改写、虚拟人像生成等技术。该技术最初应用于影视制作、虚拟直播等正规场景,如今被大量滥用,衍生多重安全危害。
在个人与民生层面,深度伪造换脸、变声技术成为电信网络诈骗的核心工具。不法分子伪造亲友、领导、公检法人员的音视频,诱导受害者转账汇款,诈骗案件案发量、涉案金额持续上升。同时,恶意伪造他人不雅视频、负面视频进行人身攻击、敲诈勒索,侵犯公民肖像权、名誉权、隐私权,引发大量民事与刑事案件。
在企业与商业层面,伪造企业高管讲话、产品宣传视频、合作协议图文,发布虚假商业信息,制造商业谣言,扰乱正常市场秩序,引发品牌危机、合作纠纷与经济损失。部分攻击者伪造企业内部会议视频、涉密文件截图,窃取商业机密。
在公共治理层面,伪造政务人员讲话、政策解读视频、突发事件现场画面,散布虚假政务信息、社会谣言,误导公众认知,干扰社会秩序,甚至影响公共安全与应急处置工作。
当前行业乱象主要体现在三个方面:一是小型 AI 工具、网页端深度伪造程序无门槛开放,缺乏实名认证与使用监管;二是伪造内容传播渠道分散,短视频平台、社交群组成为主要传播载体,溯源与下架难度大;三是跨平台伪造技术持续升级,低算力设备即可制作高仿真内容,风险扩散速度难以控制。
四、AI 驱动攻防体系分析
(一)AI 赋能网络攻击的技术路径
AI 对网络攻击的赋能,贯穿情报收集、攻击策划、内容生成、攻击实施、痕迹清除全流程,形成闭环式智能攻击体系。
情报收集阶段,攻击者利用 AI 爬虫、文本分析、图像识别技术,批量抓取目标企业官网、社交账号、员工信息、组织架构、业务流程等公开数据,快速构建目标画像,为精准攻击提供数据支撑。传统人工信息搜集耗时漫长,AI 可在数小时内完成全域信息抓取与梳理。
攻击策划阶段,AI 基于收集到的情报,分析目标的安全薄弱点、人员作息、沟通习惯,自动制定攻击方案,选择钓鱼、渗透、诈骗等最优攻击方式,实现攻击策略智能化定制。
内容生成阶段是核心环节,依托大语言模型、多模态模型生成文本、语音、视频、代码等攻击载体,根据目标特征调整内容风格,规避基础安全检测。
攻击实施阶段,AI 结合自动化工具批量分发攻击内容、发起网络请求、执行入侵操作,实现 7×24 小时不间断攻击,突破人工操作的时间限制。
痕迹清除阶段,AI 可自动篡改日志、清理攻击记录、伪造正常访问行为,增加攻击溯源、取证的难度,提升攻击者的隐蔽性。
整体来看,AI 驱动的攻击体系具备全流程自动化、目标精准化、行为隐蔽化的特点,传统依靠人工研判、静态规则防御的模式已无法有效应对。
(二)AI 技术在网络防御中的落地应用
面对 AI 驱动的新型攻击,网络防御体系也全面引入 AI 技术,形成 “以 AI 对抗 AI” 的防御格局,目前主流落地场景分为六大类。
第一,智能威胁检测。基于机器学习、深度学习模型,对网络流量、邮件内容、终端文件、社交信息进行实时分析,识别 AI 生成的钓鱼内容、恶意代码、异常流量。区别于传统关键词匹配,AI 检测模型可理解文本语义、识别内容特征,精准拦截高仿真钓鱼信息。
第二,异常行为分析。在企业内网、AI 平台、业务系统中,通过 AI 建模学习正常用户、设备、接口的行为基线,一旦出现越权访问、批量数据导出、异常提示词输入、非常规操作等行为,立即触发告警,防范内网入侵与数据窃取。
第三,恶意代码查杀。利用 AI 对代码特征、运行行为进行分析,识别经过混淆、免杀处理的 AI 生成恶意程序,弥补传统特征码杀毒软件的短板,提升终端与服务器的恶意程序查杀能力。
第四,流量智能分析。针对 DDoS 攻击、自动化扫描、异常网络请求,AI 实时分析流量特征、来源 IP、访问规律,区分正常业务流量与攻击流量,自动拦截攻击源、调度防护资源。
第五,攻击溯源与取证。AI 对攻击内容、IP 地址、传播链路进行关联分析,快速梳理攻击链条、定位攻击者来源、固定电子证据,为事后处置、司法取证提供支撑。
第六,AI 模型自身防护。针对私有化大模型,部署 AI 安全网关,检测提示词注入、数据窃取、模型滥用等行为,加固模型安全围栏,保障 AI 系统稳定运行。
(三)攻防对抗的技术博弈与发展趋势
当前网络空间形成智能攻击与智能防御双向迭代的博弈格局,技术对抗呈现明显的螺旋上升态势。攻击方持续优化 AI 生成算法,提升伪造内容仿真度、恶意代码免杀能力、攻击规避能力;防御方不断迭代检测模型、优化算法精度、拓展检测维度,双方技术差距不断缩小,对抗强度持续加大。
从短期趋势来看,轻量化 AI 攻击工具会进一步普及,个人、小型黑产团队将成为主要攻击主体,中小微企业、个人用户、基层单位将成为攻击重灾区;防御端的轻量化 AI 安全产品会加速落地,面向中小企业的一体化安全网关、终端防护、反诈工具将成为市场主流。
从中长期趋势来看,攻防对抗将从单一内容对抗、代码对抗,转向模型级对抗。攻击者尝试投毒、篡改、窃取防御端 AI 检测模型,防御方则强化模型加密、动态更新、异构部署,模型安全将成为攻防核心战场。同时,跨模态对抗成为主流,针对视频、语音、3D 虚拟人像的攻防技术会成为研发重点。
此外,攻防技术的地域扩散速度加快,技术共享、工具流通加剧风险蔓延,单纯依靠单一企业、单一机构的防护难以抵御全域威胁,行业协同、联防联控成为必然选择。
五、深度伪造检测技术体系研究
(一)深度伪造技术分类与原理
按照生成内容的模态划分,深度伪造主要分为四大类别,技术原理各有差异,对应的检测难点也各不相同。
一是文本类伪造:依托大语言模型生成虚假文案、对话、文档,原理为基于预训练模型的文本续写、语义生成,特点是逻辑连贯、风格模仿度高,无明显格式漏洞。
二是图像类伪造:包括人脸替换、图像篡改、虚拟图像生成,主要基于 GAN 生成对抗网络、扩散模型,通过像素重构实现图像伪造,部分伪造图像存在面部细节、光影、边缘不协调等特征。
三是语音类伪造:分为语音克隆、语音变声、语音合成,依托声纹模型、时序生成算法复刻人声,伪造语音在频谱、节奏、呼吸细节上可能存在细微异常。
四是视频类伪造:融合图像与语音伪造技术,对视频画面、人物口型、配音进行同步篡改,技术复杂度最高,也是当前危害最大、检测难度最高的类型。
(二)主流检测技术路线与技术优劣对比
目前行业内深度伪造检测主要分为人工核验、传统特征检测、人工智能检测、溯源技术四大技术路线。
1. 人工核验
依靠专业人员凭借经验分辨内容真伪,优势是判断逻辑灵活,可结合场景综合研判;劣势是效率极低、无法应对规模化内容,主观判断易出错,仅适用于小范围、高价值内容核查,无法满足互联网海量内容检测需求。
2. 传统特征检测
提取音视频、图像的底层物理特征,如像素点、光影、帧率、音频频谱、声纹特征等,通过比对正常内容与伪造内容的特征差异实现检测。优势是技术成熟、算力消耗低;劣势是面对新型伪造算法、高清伪造内容时,特征差异不断缩小,检测准确率持续下降,易被绕过。
3. 人工智能检测
当前主流技术路线,分为监督学习、无监督学习、多模态融合检测三类。通过海量真实内容与伪造内容训练检测模型,学习伪造内容的隐性特征。多模态融合检测可同时分析画面、声音、口型、字幕等多维信息,综合判断真伪,检测准确率最高。优势是适配新型伪造技术、可规模化部署、自动化运行;劣势是需要海量标注数据集、模型训练成本高,算法需要持续迭代。
4. 内容溯源技术
基于数字水印、区块链、内容签名等技术,在正规内容生产环节嵌入唯一标识,传播过程中一旦内容被篡改、伪造,即可通过溯源标识识别。优势是从源头防范伪造,可信度高;劣势是需要全产业链配合部署,存量无溯源标识的内容无法检测,落地推广难度大。
综合对比来看,AI 多模态检测 + 内容溯源是现阶段最优组合方案,前者负责存量、外来伪造内容检测,后者从源头管控新增内容安全。
(三)落地场景、现存痛点与优化方向
深度伪造检测技术主要落地于短视频平台、社交平台、通信运营商、公安反诈系统、企业风控系统、媒体机构六大场景,承担内容审核、反诈拦截、舆情风控、证据核验等职能。
当前技术落地存在四大核心痛点:第一,模型泛化能力不足,针对小众伪造工具、新型算法生成的内容,检测准确率大幅下滑;第二,算力成本偏高,多模态视频检测对服务器算力要求高,中小机构部署压力大;第三,实时性不足,高清长视频检测耗时较长,难以满足实时直播、即时消息的拦截需求;第四,对抗样本干扰,攻击者对伪造内容进行轻微处理,即可绕过检测模型。
后续技术优化方向:一是研发轻量化检测模型,降低算力消耗,适配边缘设备与中小机构;二是构建共享训练数据集与模型迭代机制,行业协同更新算法;三是融合被动检测与主动溯源技术,打造 “源头管控 + 事中检测” 一体化体系;四是针对实时场景优化算法架构,提升检测速度,实现毫秒级响应。
六、AI 安全评估框架构建
(一)AI 安全评估的必要性与评估维度
生成式 AI 产品与平台存在模型漏洞、数据风险、滥用风险、供应链风险、运维风险等多重隐患,若缺乏标准化安全评估,直接上线运行极易引发数据泄露、恶意使用、系统被入侵等安全事件。开展系统化 AI 安全评估,是 AI 产品上线、运维、合规运营的前置必要环节。
结合网络安全、数据安全、人工智能安全相关法规与行业实践,AI 安全评估分为五大核心维度:模型安全、数据安全、应用安全、供应链安全、运维与管理安全。模型安全聚焦算法漏洞、后门、投毒、提示词注入等问题;数据安全覆盖训练数据、交互数据、敏感数据的全生命周期防护;应用安全针对 AI 对外接口、集成模块、业务场景的风险;供应链安全核查上下游组件、开源代码、第三方服务风险;运维管理安全关注权限管控、审计、应急响应、人员管理等制度落地情况。
(二)通用 AI 安全评估框架设计
本报告结合生成式 AI 特性,设计三级分层式 AI 安全评估框架,分为一级评估域、二级评估指标、三级检测项,覆盖全风险场景,适用于公有 AI 服务、私有化大模型、行业定制 AI 系统等各类产品。
第一层级(评估域):共五大域,即模型安全域、数据安全域、应用安全域、供应链安全域、运维管理安全域。
第二层级(评估指标):每个评估域下设细分指标。模型安全域包含模型抗攻击能力、模型防窃取能力、安全围栏有效性、算法合规性;数据安全域包含训练数据安全、用户交互数据防护、敏感数据识别与脱敏、数据留存与销毁;应用安全域包含接口安全、提示词防护、访问控制、业务风控;供应链安全域包含开源组件安全、第三方服务安全、软硬件供应链溯源;运维管理安全域包含权限管理、日志审计、应急处置、人员安全管理。
第三层级(检测项):针对每一项指标设置具体检测内容、判定标准、测试方法,采用自动化工具检测 + 人工渗透测试 + 文档核查相结合的方式开展评估,最终形成量化评分、风险清单、整改建议。
该框架兼顾技术检测与管理核查,既适配技术型风险排查,也满足合规审计要求,可灵活适配不同规模、不同应用场景的 AI 系统。
(三)生成式 AI 产品分级评估标准与实施要点
根据 AI 产品的应用范围、处理数据敏感度、对外服务规模,将生成式 AI 产品划分为 \\ 一级(通用民用级)、二级(行业商用级)、三级(核心涉密级)\\ 三个安全等级,对应不同的评估要求与防护标准。
一级通用民用级:面向普通个人用户,处理非敏感公开数据,评估重点为基础内容风控、防滥用、基础接口防护,评估频次为每年一次。
二级行业商用级:应用于金融、通信、互联网、企业办公等场景,处理企业经营数据、用户个人信息,评估要求全面覆盖五大评估域,开展渗透测试与压力测试,评估频次为每半年一次。
三级核心涉密级:应用于政务、关键信息基础设施、涉密单位,处理涉密数据、核心敏感数据,要求全项最高标准评估,增加模型加密、物理隔离、离线部署等专项检测,评估频次为每季度一次,同时要求 7×24 小时持续监测。
实施要点:评估工作需在产品上线前、版本重大更新后、安全事件发生后强制启动;评估过程全程留痕,检测报告、风险整改记录归档留存;高等级 AI 产品需引入第三方专业机构开展独立评估,保障评估客观性。
七、AI 时代供应链安全治理
(一)数字供应链安全风险新特征
人工智能产业链供应链涵盖硬件芯片、操作系统、开源框架、预训练模型、第三方插件、运维服务、应用组件等多个环节,链条长、参与主体多、开源组件占比高。相较于传统 IT 供应链,AI 时代供应链安全风险呈现新特征。
第一,开源依赖度极高。绝大多数 AI 框架、模型、工具基于开源项目开发,开源代码中潜藏后门、漏洞、恶意组件的风险大幅上升,且开源社区迭代速度快,漏洞披露与修复存在时间差。
第二,链条全球化、复杂化。AI 软硬件、算法组件来自全球各地,供应链节点分散,溯源、管控难度大,单一节点出现风险即可传导至整个 AI 系统。
第三,风险传导性强。供应链上游的一个漏洞、恶意组件,会随着组件集成扩散到下游所有使用方,形成规模化安全事件。
第四,隐蔽性增强。恶意代码、后门程序嵌入在底层框架、模型权重文件中,常规杀毒、代码审计难以发现,潜伏周期长。
(二)AI 产业链供应链安全薄弱环节
梳理全链条后,当前主要薄弱环节集中在四个部分。一是开源 AI 框架与组件,开源库漏洞、未授权后门、代码不规范是主要风险;二是第三方预训练模型,外部采购的模型可能存在数据投毒、模型后门、训练数据泄露问题;三是外包开发与运维服务,第三方合作人员、外包团队带来内部访问权限滥用、数据窃取风险;四是终端与边缘硬件,AI 算力硬件、采集终端存在固件漏洞、远程控制漏洞。
此外,多数企业缺乏供应链安全管理制度,对引入的外部组件、模型、服务不做安全检测,直接集成使用,进一步放大风险。
(三)全链路供应链安全防护策略
针对 AI 供应链风险,建立准入检测、过程管控、持续监测、应急处置全链路防护体系。
准入环节:建立供应链供应商白名单,对所有外部引入的开源组件、AI 模型、第三方服务开展安全检测、代码审计、漏洞扫描,存在风险的组件禁止集成使用。
使用环节:对外部组件进行版本管控,及时跟进开源社区漏洞预警,定期更新安全补丁;划分供应链组件权限,限制外部组件访问核心数据与系统资源。
监测环节:部署供应链安全监测平台,实时监控组件运行状态、版本变化、异常行为,一旦发现组件异常、漏洞利用行为立即告警。
应急环节:制定供应链安全应急预案,建立组件快速替换机制,当上游组件曝出高危漏洞或恶意行为时,第一时间下线、替换问题组件,阻断风险传导。
同时,优先推动核心 AI 组件自主可控,降低对外部开源产品、境外组件的依赖,从根源上提升供应链安全韧性。
八、零信任架构在 AI 安全领域的融合应用
(一)零信任架构核心理念与适配价值
零信任架构的核心原则为永不信任、始终验证、最小权限、动态授权,摒弃传统 “内网可信、外网不可信” 的边界安全理念,无论访问主体来自内网还是外网,都需要进行身份、设备、行为、环境的全维度验证。
AI 系统具备接口开放、多方访问、数据集中、外部集成多的特点,传统边界防护架构无法有效管控访问行为,零信任架构与 AI 安全具备高度适配性。其核心价值体现在三方面:一是严格管控人员、设备、第三方系统对 AI 模型、数据、接口的访问权限,防范越权访问;二是动态评估访问风险,根据行为实时调整权限,阻断异常操作;三是全链路行为审计,所有访问、操作行为可追溯,满足合规与取证要求。
(二)零信任与 AI 系统融合部署方案
结合 AI 平台架构,零信任采用分层部署模式,分为接入层、应用层、数据层三层防护。
接入层:所有访问 AI 平台的用户、终端、外部接口,均经过零信任网关接入,完成身份认证、设备可信校验、环境安全检测,非法设备、匿名身份直接拦截。
应用层:针对 AI 模型、对话接口、管理后台划分不同权限角色,遵循最小权限原则,普通用户仅可使用基础对话功能,管理人员仅分配必要运维权限,禁止权限泛化。同时对提示词输入、模型调用频次进行管控,防范批量调用、恶意诱导。
数据层:对 AI 训练数据、用户交互数据、敏感业务数据进行分级隔离,即使上层应用被突破,也无法直接访问核心数据;数据导出、批量查询等高危操作设置多重审批与实时监控。
(三)基于零信任的权限管控与行为审计
权限管控采用静态基线 + 动态调整模式,静态阶段基于岗位、角色分配基础权限;动态阶段结合用户操作行为、访问时间、访问地点、设备状态综合评分,风险评分过高则自动降级权限、阻断访问。
行为审计方面,零信任平台完整记录所有用户的登录行为、提示词内容、模型调用记录、数据操作记录、接口访问日志,日志长期留存、不可篡改。针对批量调用模型、高频敏感词汇输入、大量数据导出等异常行为,自动生成审计告警,管理人员可实时核查、追溯行为源头。零信任审计体系同时满足网络安全、数据安全法规的审计留痕要求。
九、数据泄露防护与 AI 反诈技术实践
(一)AI 场景下数据泄露的风险类型与传播路径
AI 系统汇聚海量训练数据、用户对话数据、企业业务数据、个人信息,数据泄露风险远高于传统系统。主要泄露类型包括:训练数据被窃取、用户交互对话泄露、接口数据越权获取、内部人员违规导出数据、模型逆向推导还原原始数据。
传播路径分为线上网络窃取、内部违规流转、第三方合作泄露、模型漏洞泄露四类。攻击者可通过漏洞入侵、提示词诱导、接口攻击等方式远程窃取数据;内部员工利用权限违规拷贝、外传数据;第三方合作厂商、外包人员接触数据后造成泄露;攻击者通过模型逆向算法,从 AI 输出结果反推原始训练数据。
(二)全维度数据泄露防护技术体系
构建事前脱敏、事中监控、事后溯源的数据泄露防护体系。
事前防护:对 AI 训练数据、交互数据进行分级分类,敏感个人信息、商业数据采用脱敏、加密处理,在数据进入模型前去除明文敏感字段;禁止核心原始数据直接对外输出。
事中防护:部署数据防泄漏(DLP)系统,监控 AI 平台、终端、邮件、社交渠道的数据传输行为,拦截批量数据导出、明文敏感数据外传;对 AI 模型输出内容进行敏感词检测,防止模型主动泄露数据。
事后溯源:为每一份核心数据添加溯源水印,数据泄露后可快速定位泄露环节与责任人;结合日志审计、流量分析完成事件复盘,同步加固安全策略。
(三)AI 反诈技术原理、模型与实战应用
AI 反诈是当前对抗深度伪造诈骗、智能语音诈骗、文本钓鱼诈骗的核心技术,技术原理为依托机器学习模型,对通话语音、视频画面、聊天文本、交易行为进行多维度特征分析,识别诈骗行为。
主流反诈模型分为语音检测模型、视频深度伪造检测模型、文本风控模型、行为风控模型四大类,多模型联动形成一体化反诈系统。语音模型识别克隆语音、诈骗话术;视频模型检测换脸、篡改视频;文本模型拦截诈骗短信、聊天话术;行为模型分析转账行为、账号操作规律,识别异常交易。
实战应用中,AI 反诈系统部署于通信运营商、银行、公安反诈平台、社交平台,实现实时拦截、风险预警、账号管控、线索上报全流程处置。针对高频诈骗场景自动拦截通话、短信、转账操作,对高风险用户进行弹窗提醒,同时将诈骗线索同步至公安部门,开展溯源打击。目前 AI 反诈技术已成为压降电信网络诈骗案发量的核心技术手段。
十、现存行业挑战、发展趋势与对策建议
(一)当前行业整体面临的核心挑战
综合全文研究,当前网络安全与 AI 安全领域面临五大共性挑战:一是技术迭代速度失衡,生成式 AI 技术更新快,安全防护技术、检测模型跟进滞后;二是行业能力不均,大型企业安全体系完善,中小微企业、基层机构安全投入不足,防护能力薄弱;三是跨主体协同不足,企业、平台、监管、公安之间数据共享、联防联控机制不完善;四是人才缺口巨大,AI + 网络安全复合型人才稀缺,难以满足行业发展需求;五是法律法规落地配套不足,深度伪造使用规范、AI 安全监管细则仍需完善。
(二)全球 AI 与网络安全融合发展趋势
第一,“AI 对抗 AI” 成为主流防护模式,智能攻防、多模态检测、模型级防护全面普及。
第二,安全左移常态化,安全评估、风险检测嵌入 AI 产品研发、训练、上线全流程。
第三,架构融合加深,零信任、云安全、数据安全与 AI 系统深度结合,形成一体化安全架构。
第四,行业标准逐步统一,AI 安全评估、深度伪造检测、供应链安全的行业标准、国家标准加速出台。
第五,全域联防联控,政企、平台、监管、执法部门协同联动,构建全网安全防护网络。
(三)综合应对策略建议
1. 企业层面:树立 AI 原生安全理念,将安全融入 AI 项目全生命周期;搭建零信任、数据防泄漏、AI 检测一体化防护体系;定期开展安全评估、渗透测试与应急演练;加强内部人员安全培训,防范内部风险。
2. 行业层面:推动行业共享安全数据集、漏洞库、检测模型,降低中小机构技术成本;组建行业安全联盟,开展联防联控与技术交流;统一行业安全规范与评估标准。
3. 监管与执法层面:完善生成式 AI、深度伪造技术的使用监管规则,落实实名使用制度;加大对 AI 诈骗、恶意伪造、网络攻击行为的打击力度;引导企业落实安全主体责任。
4. 人才培养层面:高校、企业联合开展 AI + 网络安全复合型人才培养,完善人才梯队建设,填补行业人才缺口。
十一、数据来源说明
1. 网络安全威胁监测数据:国内主流网络安全厂商 2024-2026 年全网威胁态势报告、钓鱼攻击、恶意代码、DDoS 攻击统计数据。
2. 深度伪造相关数据:短视频平台内容审核统计、公安部门电信网络诈骗案件分析报告、多模态伪造技术检测公开测试数据集。
3. AI 安全行业数据:人工智能安全白皮书、大模型安全漏洞统计报告、开源组件安全漏洞数据库。
4. 供应链安全数据:开源安全社区漏洞披露记录、全球 AI 产业链供应链风险分析报告。
5. 反诈相关数据:通信运营商反诈监测数据、全国电信网络诈骗形势分析报告、金融机构交易风控统计数据。
6. 标准与规范依据:《生成式人工智能服务管理暂行办法》《网络安全等级保护 2.0》《数据安全法》《个人信息保护法》及人工智能安全相关行业技术标准。
十二、免责声明
1. 本报告由淞基科技(上海)有限公司、淞基信息通信研究院独立编制,报告内容仅用于行业研究、技术参考、内部决策,不构成任何商业投资、技术采购、法律判定的直接依据。
2. 本报告所引用的数据、案例、技术观点均来源于公开渠道与行业实测,编制方尽力保障内容真实、准确、完整,但不对外部数据的绝对有效性、时效性承担担保责任。
3. 报告中提出的技术框架、评估标准、防护方案为通用性行业方案,不同企业、不同场景需结合自身实际情况进行适配调整,因直接照搬本报告内容开展建设而产生的一切风险,由使用方自行承担。
4. 本报告版权归编制单位所有,未经淞基科技(上海)有限公司、淞基信息通信研究院书面授权,任何单位及个人不得对本报告内容进行篡改、节选、转载、商用传播。
5. 人工智能与网络安全技术处于持续迭代过程中,本报告观点基于 2026 年 6 月前的技术与行业现状,后续技术更新、政策调整、风险变化均不再另行补充通知。
6. 对于因使用本报告内容所引发的直接或间接损失,编制单位不承担任何法律责任。