基于改进变分自动编码器的入侵检测模型构建及仿真.pdf
《基于改进变分自动编码器的入侵检测模型构建及仿真.pdf》由会员分享,可在线阅读,更多相关《基于改进变分自动编码器的入侵检测模型构建及仿真.pdf(8页珍藏版)》请在咨信网上搜索。
1、第 35 卷 第 2 期2023 年 6 月河南工程学院学报(自然科学版)JOURNAL OF HENAN UNIVERSITY OF ENGINEERING(NATURAL SCIENCE EDITION)Vol.35,No.2Jun.2023 基于改进变分自动编码器的入侵检测模型构建及仿真 曹春梅(合肥幼儿师范高等专科学校 信息技术中心,安徽 合肥 230013)摘 要:针对现有网络流量入侵检测查准率低的问题,提出了一种基于改进变分自动编码器的入侵检测方法,先在变分自动编码器上增加判别器实现网络流量的入侵检测,之后在 CICIDS2017 数据集上对所提方法进行验证。结果表明,所提方法对正
2、常流量与异常流量检测的平均查准率、召回率、F1 值均达到 87%以上,且平均 AUC 值达 90%。相较于 CE-SAE 模型和传统变分自动编码器,所提方法在各项指标上的表现更好,具有明显优势。关键词:网络安全;入侵检测;生成对抗网络;变分自动编码器;查准率 中图分类号:TP399 文献标志码:A 文章编号:1674-330X(2023)02-0063-07Construction and simulation of intrusion detection model based on improved COD-VAE modelCAO Chunmei(Information Technolo
3、gy Center,Hefei Preschool Teachers College,Hefei 230013,China)Abstract:Aiming at the problem of low accuracy of intrusion detection in existing network traffic,an intrusion detection method based on improved COD-VAE model is proposed.Methods by adding a discriminator to the COD-VAE model and using t
4、he GAN network confrontation learning method to build the model,the network traffic intrusion detection is realized.Finally,the proposed method is verified on CICIDS2017 data set.The results show that the proposed intrusion detection method based on the improved COD-VAE model has good detection perf
5、ormance.The average precision,recall and F1 value of normal and abnormal traffic are more than 87%,and the average AUC value is 90%.Compared with CE-SAE model and traditional COD-VAE model,the proposed method performs better in various indicators and has obvious advantages.Keywords:network security;
6、intrusion detection;generate confrontation network;COD-VAE model;precision ratio收稿日期:2022-07-19基金项目:安徽省高等学校省级质量工程项目(2021zyyh034)作者简介:曹春梅(1984),女,安徽合肥人,讲师,主要研究方向为计算机技术。对网络流量进行入侵检测是确保网络安全的重要手段,正日益受到人们的关注。为实现异常流量的检测,王文涛等1提出一种特征选择结合 SAE-LSTM 的入侵检测模型,通过随机森林打分策略与聚类思想选择特征以降低算法的计算量,同时采用稀疏自动编码器对数据进行重构,利用 LST
7、M 卷积网络实现网络流量的异常检测;任家东等2通过计算网络流量特征的皮尔逊相关系数对特征进行筛选,采用随机森林和决策树算法分别对网络流量进行分类,实现了工业互联网的入侵检测;朱龙隆等3根据网络流量入侵时服务器缺乏鲁棒性的特点,提出了一种基于拟态防御的网络流量入侵检测方法,并基于真实流量数据对所提方法进行了验证,结果表明该方法具有较高的查准率。目前网络流量入侵检测研究积累了丰硕的成果,但普遍认为检测的查准率有待提高,原因是现有方法对正常网络流量的空间分布学习能力有限4。为提升网络流量入侵检测的查准率,本研究提出了一种基于改进变分自动编码器的入侵检测方法。1 1 基本算法1.1 变分自动编码器变分
8、自动编码器采用概率分布构建由一个编码器和一个解码器构成的自编码器网络,其基本网络结构河南工程学院学报(自然科学版)2023 年如表 1 所示。编码器负责从概率角度对输入数据集的多维度均值和方差进行拟合,进而求解数据集的后验概率分布 q(z|x),解码器负责基于变分近似分布 p(x|z)还原输入数据集 x。其中,、为参数,z 表示隐藏层空间向量,即隐藏层维度。表 1 变分自动编码器网络结构Tab.1 Network structure of variational automatic encoder层输出形状 激活函数步幅填充卷积核Encoder Layer(None,80,1)Noneconv
9、ld_l(None,40,32)RelucSame(32,3)convld_2(None,20,64)RelucSame(64,3)flatten(None,1 280)Noneencoded_hidden(None,16)Reluz_mean(None,2)Nonez_log_var(None,2)Nonesampling(None,2)NoneDecoder Layer(None,2)Nonedecoded_hidden(None,1 280)Relureshape(None,20,64)Noneconvld_transpose_1(None,40,64)Relu2Same(64,3)co
10、nvld_transpose_2(None,80,32)Relu2Same(32,3)convld_transpose_3(None,80,1)Relu1Same(1,3)变分自动编码器通过重构误差和 KL 散度误差进行参数的迭代更新,达到模型训练的目的5。重构误差反映了输入数据集 x 与重构数据集x 的相似性,数学描述见式(1);KL 散度误差即利用 KL 散度反映生成正态分布与标准正态分布的离散程度,可通过式(2)描述6:J(;x;x)=12hW,b(x)-x2,(1)KL(N(,2)N(0,1)=12(-lg 2+2+2-1)。(2)训练变分自动编码器的解码器时,适当降低 KL 散度误差
11、,有利于模型更快达到训练目的。解码器训练完成后,适当增加 KL 散度误差,可避免模型过拟合。变分自动编码器可通过一维卷积计算网络流量序列化特征,并利用后验概率学习正常流量特征,进而实现对网络异常流量的检测,但其检测性能有待提高7。为解决该问题,在变分自动编码器基础上采用GAN 生成对抗思想,通过生成器和判别器对抗的方式构建入侵检测模型,以更好地学习正常网络流量空间分布,区分正常流量与异常流量,提高模型的入侵检测能力。图 1 GAN 结构Fig.1 GAN structure1.2 生成式对抗网络生成式对抗网络(generative adversarial networks,GAN)是一种基于对
12、抗学习的无监督生成模型,相较于传统监督学习模型,GAN 直接通过判别器反馈结果,无须通过标签数据计算损失,故具有更好的判别效果。GAN 由生成器和判别器组成8,如图 1 所示。生成器负责将输入的随机噪声生成假数据,判别器则负责对生成器生成的假数据和真实数据进行判别,并输出判别结果。生成器的训练通过判别器的误差反向传播到生成器更新参数实现,判别器的训练则根据生成器更新参数后生成的假数据及真实数据更新参数实现。设GAN生成器G通过先验分布Pz(z)生成的假数据特征分布为 Pg,判别器 D 输出的真实数据概率为46第 2 期曹春梅:基于改进变分自动编码器的入侵检测模型构建及仿真D(x;d),则 GA
13、N 的目标函数9可表示为minGmaxD V(D,G)=Ex Pdata(x)lg D(x)+Ez Pz(z)lg(1-D(G(z),(3)式中:Pdata(x)表示真实数据分布;lg D(x)表示判别器对真实数据的判别结果;lg(1-D(G(z)表示判别器对假数据的判断结果。利用 GAN 生成对抗思想改进变分自动编码器,得到改进后的变分自动编码器网络结构,如表 2 所示。表 2 改进变分自动编码器网络结构Tab.2 Network structure of improved variational automatic encoderGAN层输出形状 激活函数步幅填充生成器Encoder_1(
14、None,2,6)Relu2SameDecoder(None,80,1)ReluSameEncoder_2(None,2,6)Relu2Same判别器Encoder(None,2,1)Leaky Relu0ValidActivation(None,2,1)Sigmoid2 2 基于改进变分自动编码器的入侵检测2.1 改进变分自动编码器构建改进变分自动编码器的构建包括特征工程、异常得分、决策阈值 3 个阶段。2.1.1 特征工程阶段初始化模型的各层参数W1,W2,Wn和b1,b2,bn,并利用前向传播卷积核计算特征向量的均值 和方差。训练判别器 D。训练过程中需要固定生成器 G 的参数,同时根据
15、式(4)更新输入数据权重,根据式(5)计算样本为真的概率,并采用 adam 算法更新权重 W1、W2和偏置 b1、b210:Dh1=Leaky Re lu(inputW1+b1),(4)Output=sigmoid(Dh1W2+b2)。(5)训练生成器 G。训练过程中需要固定判别器 D 的参数,利用 Eecoder_2 学习隐藏层空间特征,同时根据式(6)和式(7)更新隐藏层权重和偏置,并采用 adam 算法更新权重和偏置11:Lcon=Ex pxx-G(x)1,(6)Lenc=Ex pxGE(x)-E(G(x)2。(7)当模型损失函数接近局部最小时,模型训练完成。2.1.2异常得分阶段将特征
16、流量输入模型得到隐藏层空间向量 z 和重构隐藏层空间向量z,之后根据式(8)计算每个网络流量的异常得分12:score=z-z2。(8)2.1.3决策阈值阶段利用已知的正常与异常流量分布 p,得到分布决策阈值=pscore。(9)通过上述 3 个阶段的操作,实现了改进变分自动编码器的构建。2.2 基于改进变分自动编码器的入侵检测流程用 2.1 节构建的改进变分自动编码器对网络入侵进行检测,具体流程如下:(1)数据采集与预处理。考虑到原始网络流量存在噪声等影响,采用去奇异、归一化和抽样等方式进行预处理。(2)利用预处理后的网络流量生成一维网络流量特征向量,并输入改进变分自动编码器学习网络流量的统
17、计特征。(3)利用异常得分区分正常网络流量与异常网络流量,并输出结果。56河南工程学院学报(自然科学版)2023 年完整的基于改进变分自动编码器的入侵检测流程如图 2 所示。图 2 基于改进变分自动编码器的入侵检测流程Fig.2 Intrusion detection flow based on improved variational automatic encoder3 3 仿真实验3.1 实验环境搭建本实验在 Ubuntu 16.04 操作系统中进行,硬件配置为 Intel(R)Xeon(R)Silver 4208R 处理器、Nvidia GPU(GeForce GTX2060)显卡,计
18、算框架为 CUDA 10.1,通过 Tensorflow 2.3.1 深度学习框架和 cuDNN 7.6.0深度神经网络库实现。3.2 数据来源及预处理本实验数据来自 CICIDS2017 数据集13,该数据集包括最常见的网络攻击类型及 CICFlowMeter 网络流量分析结果,是一个高度不平衡的多类数据集。将 CICIDS2017 数据集划分为异常类样本和正常类样本,并将正常类样本按照 41的比例划分为训练集和测试集,同时从异常类样本中随机抽取部分样本加入测试集。为更好地进行网络流量特征学习,需要将数据包的五元组(目的地址、目的端口、源地址、源端口、传输协议)转化为具有流式特征的网络数据流
19、。实验采用 CICFLOWMETER 生成器生产可在源地址和目标地址往返传输的双向流。考虑到数据中存在异常值和 IP 地址信息等强相关性特征维度,且包含众多不规则散布的数据信息,所以实验前对数据进行异常值清洗和规范化处理。针对异常值和强相关性特征维度进行直接删除处理;针对不规则散布的数据信息采用 min-max 归一化方式进行处理:x=x-xminxmax-xmin,(10)式中:x 为原始数据;xmax、xmin分别为 x 的最大值和最小值;x 为预处理后的数据。考虑到数据集中 Heartbleed、Infiltration、Web Attack 等网络攻击的恶意攻击数据量过小,同时为确保训
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 基于 改进 自动 编码器 入侵 检测 模型 构建 仿真
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,个别因单元格分列造成显示页码不一将协商解决,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【自信****多点】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【自信****多点】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。