融合CNN-BiGRU和注意力机制的网络入侵检测模型.pdf
《融合CNN-BiGRU和注意力机制的网络入侵检测模型.pdf》由会员分享,可在线阅读,更多相关《融合CNN-BiGRU和注意力机制的网络入侵检测模型.pdf(7页珍藏版)》请在咨信网上搜索。
1、信息安全研究第10 卷第3期2 0 2 4年3月Journalot information Security ResearchVol.10No.3Mar.2024DOl:10.12379/j.issn.2096-1057.2024.03.02融合(CNN-BiGRU和注意力机制的网络入侵检测模型杨晓文张健况立群庞敏(中北大学计算机科学与技术学院太原(机器视觉与虚拟现实山西省重点实验室(山西省视觉信息处理及智能机器人工程研究中心太原0 30 0 51)()A Network Intrusion Detection Model Integrating CNN-BiGRU andAttentionM
2、echanism030051)太原030051)Yang Xiaowen,Zhang Jian,Kuang Liqun,and Pang Min(School of Computer Science and Technology,North University of China,Taiyuan 030051)(Shanzi Key Laboratory of Machine Vision and Virtual Reality,Taiyuan 030051)(Shanzi Provinces Vision Information Processing and Intelligent Robo
3、t Engineering Research Center,Taiyuan 030051)Abstract To enhance the feature extraction capabilities and classification accuracy of the networkintrusion detection model,a network intrusion detection model integrating CNN-BiGRU(Convolutional Neural Network-Bi-directional Gated Recurrent Unit)and atte
4、ntion mechanism isproposed.CNN is employed to effectively extract nonlinear features from traffic datasets,whileBiGRU extracts time-series features.The attention mechanism is then integrated to differentiatethe importance of different types of traffic data through weighted means,thereby improvingthe
5、overall performance of the model in feature extraction and classification.The experimental resultsindicate that the overall accuracy rate is 2.25%higher than that of the BiLSTM(Bi-directionalLong Short-Term Memory)model.K-fold cross-validation results demonstrate that the proposedmodels good general
6、ization performance,avoiding the occurrence of over-fitting phenomenon,andaffirming its effectiveness and rationality.Key words network intrusion detection;convolutional neural network;bidirectional gated recurrentunit;attention mechanism;deep learning摘要为提高网络入侵检测模型特征提取能力和分类准确率,提出了一种融合双向门控循环单元(CNN-Bi
7、GRU)和注意力机制的网络入侵检测模型.使用CNN有效提取流量数据集中的非线性特征;双向门控循环单元(BiGRU)提取数据集中的时序特征,最后融合注意力机制对不同类型流量数收稿日期:2 0 2 3-0 7-0 3基金项目:国家自然科学基金项目(6 2 2 7 2 42 6,6 2 10 6 2 38);山西省科技成果转化引导专项(2 0 2 10 40 2 130 10 55)通信作者:张健(17 2 40 557 32 )引用格式:杨晓文,张健,况立群,等.融合CNN-BiGRU和注意力机制的网络入侵检测模型JJ.信息安全研究,2 0 2 4,10(3):2 0 2-2 0 8202学术论文
8、.ResearchPapers据通过加权的方式进行重要程度的区分,从而整体提高该模型特征提取与分类的性能.实验结果表明:其整体精确率比双向长短期记忆网络(BiLSTM)模型提升了2.2 5%.K折交叉验证结果表明:该模型泛化性能良好,避免了过拟合现象的发生,印证了该模型的有效性与合理性。关键词网络入侵检测;卷积神经网络;双向门控循环单元;注意力机制;深度学习中图法分类号TP391近年来,网络入侵问题愈发严重,引起公众的关注.深度学习已经被应用于网络入侵检测领域,并且取得了一些检测效果.文献 1 提出了一种基于云计算的网络人侵检测模型,利用多层感知机神经网络和粒子群优化算法实现对NSL-KDD和
9、KDD-CUP数据集的人侵检测,但是其预测结果的准确性有待进一步提高.文献 2 提出了一种分布式网络安全框架,使用随机森林分类技术对CIC-IDS-2017数据集进行了网络流量的识别和分类,但是所提出的方法并不能识别每一种流量类别.文献 3 在CIC-IDS-2018数据集上使用ReLu作为每个卷积层的激活函数,表明了卷积神经网络的准确度高于循环神经网络,但是针对一些特定类别的网络攻击,其预测精度还是低于7 0%.文献 4提出RNN-LSTM模型的入侵检测方法,使用KDD99数据集实现了对网络流量的分类,但是数据集网络流量种类少,缺乏说服力.文献 5 提出了CNN-BiLSTM模型,在数据集D
10、ARPA1998上进行特征提取并且分类,但是在进行特征提取时会损失特征的时间特性.文献 6 使用堆叠LSTM网络检测拒绝服务攻击,虽然极大程度地提高了检测精度,但是由于其模型结构复杂,参数较多,整体预测效率不高.文献 7 使用长短期记忆循环神经网络和门控循环单元模型针对物联网流量数据进行了有效的检测和追踪,但是该模型忽略了不同类型流量数据的重要性差异,同等看待不同类型数据流量导致分类预测精度的降低.根据以上文献分析,入侵检测模型的优缺点主要取决于特征提取.在现有研究中,传统的网络人侵检测方法缺乏独立学习的能力 8 ,导致检测的准确性降低.为了解决这些问题,本文针对网络流量数据的非线性和时序的特
11、点,提出了一种基于CNN-BiGRU-Attention 的网络人侵检测模型,用于检测常见的网络攻击.1相关工作深度学习模型在入侵检测领域取得了良好的研究效果,特别是CNN模型和RNN模型,其变体独立应用和组合应用时,在获取数据的时空特征方面具有显著的优势9,CNN模型在深度学习领域应用十分广泛:Vinayakumar等人 10 1的研究表明,CNN及其变体架构在网络入侵检测领域优于经典的机器学习架构;文献 11 的实验结果表明,基于 CNN的人侵检测模型展现出了良好的特征提取能力和较高的检测率,提高数据特征的质量,为提高网络流量人侵检测的准确性奠定了基础.鉴于此本文提出的模型引人了 CNN架
12、构.RNN架构在内部反馈方面优于传统的神经网络,每层之间都有前馈连接 12 ,因此可以将 CNN与RNN或者其改进模型集成在一个模型中,从而提取数据的时序特征,有效地针对网络流量进行特征分类 13,人们在观察图像时通常倾向于更多地关注图像的某些局部区域,而不是图像的整体.在ImageNet2017上,Szegedy等人 141提出了一种基于通道注意力机制激励网络,赢得了图像分类挑战.卷积注意力模块(CBAM)151是在通道注意力机制激励网络的基础上通过添加Maxpool的信道改进的,文献 15通过大量实验,表明添加注意力机制可以有效地提高模型分类的性能.基于此,本文在网络流量入侵检测中引人了注
13、意力机制来提高分类器的性能。2本文方法2.1网络入侵检测模型整体架构网络流量数据集是一种时间序列数据,本文提出的CNN-BiGRU-Attention模型在公开可用网址http:/1203信息安全研究第10 卷第3期2 0 2 4年3月Journalotinformatien Security ResearchVol.10No.3Mar.2024Dropout的数据源上进行训练,利用CNN网络的卷积和池化操作提取数据局部特征;利用前向GRU和后向GRU对时序数据进行长期依赖特征提取;并融合1维最大池化层1维卷积层数据清洗数据集平衡原始数据注意力机制对各个特征进行不同权重的分配,提出了一种基于C
14、NN-BiGRU并融合注意力机制的入侵检测模型.模型结构如图1所示:CNN模块11维卷积层维最大池化层层分类结果(4)数据预处理2.2CNN网络在本文的研究中,由于网络数据集是1维序列数据,所以使用1维卷积层进行特征提取.首先使用CNN网络对网络入侵流量数据提取特征并进行分析;CNN模型中交替配置卷积层与池化层,可以提高特征提取的效率 16 ;卷积层将网络流量数据连续映射到高维,并且从这些网络流量数据中训练出特征数据,并且及时纠正模型的检测效果;最后使用Softmax分类器对提取到的网络人侵流量特征进行分类,即可实现对网络入侵流量数据的特征提取与分类。2.3BiGRU网络GRU(门控循环单元)
15、是RNN网络的改进模型,其内部结构简单,参数更少,不仅能够避免反向传播中的梯度消失问题,而且在计算速度和效率方面优于RNN.在GRU单元中,将之前的隐藏状态与当前的输入连接,乘以各自的权重,然后通过sigmoid函数传递.重置门的结果矢量输出与之前的隐藏状态相乘,将当前输人添加到该状态,并通过tanh函数传递 17 .()=1+e-,R=o(Wmht-1+Warx,+bf),R,E0,1,r=tanh(R,O(Whaht-1)+Wrax,+b fa),rE-1,1,2041全连接层双向双向DropoutAttentionGRUGRU层层BIGRU-ATTENTION模块图1网络人侵检测模型结构
16、U=o(Wuht-1+Wabx,+bfa),U.Eo,1,u=U,O(ht-1),h,=ro(l-U.)+u,式中,为sigmoid函数,h为输人的网络流量信息,W为更新门与重置门对应输入流量数据的权值矩阵,U为本神经元输出隐状态对本神经元内隐状态数据h,与上一神经元传递隐状态数据的Hadamard乘积所赋的权重值,b 为偏置值,以上学习参数随着模型的训练而更新.在本文的网络安全态势预测中,由于网络流量数据具有时间序列的特征,具有时间依赖性 18 ,因此需要更深入的时间特征提取,尽管GRU在顺序数据的处理方面表现出强大的能力,但是它的隐藏状态只考虑前向连接进行信息捕获,而忽略后向连接进行信息捕
17、获,相比之下,双向门控循环单元(BiGRU)能获取过去的信息并且能预测未来的状态,而且BiGRU能充分利用不同类型流量的时间相关性实现全局检测并发现潜在的异常行为.12.4注意力机制(1)注意力机制专注于输人数据的最关键部分,充分挖掘了网络流量数据的深层次特征信息,聚(2)焦于高影响的流量类别特征,从而实现了对不同类别的流量数据基于重要程度分配不同的权值.注(3)意力机制的转换过程如式(7)(10)所示:全连接层模块层(5)(6)学术论文.ResearchPapersTP+TNSu=Vtanh(Wh,+Uh;+b),i=1,2,t-1,eSati,i=1,2,t-1,eSuk-iF-2a h,
18、=1,.-1,1-1h=f(F,ht,yt),式(8)的at为BiGRU隐藏层输出值h;对当前输人的注意力权重值,y1,y 2,y,为输入序列,输人序列对应的隐藏层状态值是h1,h 2,,h t,h 是最终输出的特征向量;V,W,U,b是在模型训练过程中不断更新的参数.模型中融合注意力机制提升了系统编码器-解码器的性能,有助于网络模型更高效准确地完成流量分类,同时提高了网络模型的可解释性.3实验3.1实验环境实验采用的服务器处理器为Intel?Xeon?W-2245CPU3.90GHz,内存为6 4.0 GB,显卡为GeForceRTX3090,操作系统为Linux,编程语言为python3.
19、8.13,框架为Keras2.4.3,后端采用Tensorflow 2.6.0.3.2楼数据集预处理3.2.1数据集清洗CIC-IDS-2017入侵检测数据集 8 是加拿大网络安全研究所发布的,该数据集包含良性流量和恶性攻击,经过数据清洗后的数据包含7 8 个数据特征字段和1个类别标签.3.2.2楼数据集平衡在整个数据集中,包含136 2 行NULL”和“NaN值,占比不足整个数据集的1%,因此删除了这些样本数据.然后对数据进行归一化处理,所用到的方法是min-max归一化,如式(11)所示:-Mmin2=Mm-Mm式(11)中表示将要进行归一化的值,Mmin为同一维度下的最小数值,Mmax为
20、同一维度下的最大数值.由实验可知,清洗过后的数据集高度不平衡,因此,删除了高度不平衡的网络流量攻击分类,并(7)利用随机欠采样技术减少大多数类别的大小,完成数据集的平衡.经过平衡后的数据集数据按照(8)8:2的比例拆分为训练集和测试集.同时为了将数据集输入深度学习模型,使用从0 10 的标签编(9)码器将分类变量编码为整数值.3.3评估指标(10)为了对不同类型的网络入侵流量进行精准的预测与分类,本文对不同类型的网络人侵流量分类时,将该网络流量类型视为正样本,其余流量类型均视为负样本.实验采用准确率(Accuracy)、精确率(Precision)、召回率(Recall)以及F1值(F1-Sc
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 融合 CNN BiGRU 注意力 机制 网络 入侵 检测 模型
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,个别因单元格分列造成显示页码不一将协商解决,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【自信****多点】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【自信****多点】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。