统计向量分析下大规模网络流量异常检测仿真_陈波红.pdf
《统计向量分析下大规模网络流量异常检测仿真_陈波红.pdf》由会员分享,可在线阅读,更多相关《统计向量分析下大规模网络流量异常检测仿真_陈波红.pdf(5页珍藏版)》请在咨信网上搜索。
1、收稿日期:2022-04-29 第 40 卷 第 4 期计 算 机 仿 真2023 年 4 月 文章编号:1006-9348(2023)04-0373-04统计向量分析下大规模网络流量异常检测仿真陈波红1,祝金明2(1.广西民族大学相思湖学院,广西 南宁 530225;2.广西民族大学材料与环境学院,广西 南宁 530006)摘要:为准确识别网络流量异常特征,降低用户遭受恶意攻击的概率,提出基于统计向量的大规模网络流量异常检测算法。依据网络管理协议明确节点及网络链路负载,得到网络状态和配置信息的路由矩阵,将负载值与路由矩阵引入广义回归神经网络提取流量特征,获得固定时段网络流量数据;利用 Spl
2、itCap 文件分割器将网络流量的一组源 IP 和目标 IP 交互划分至同一流量包,把流量包各字节映射为相同特征,使用 t-分布式随机邻居嵌入方法计算流量包间欧氏距离,实现流量数据降维,锁定网络流量异常时间范围;把异常检测拟作约束条件二次优化问题,采用支持向量机统计流量向量特征,引入比特压缩技术降低数据分辨率,创建支持向量机下网络流量异常检测函数,实现异常检测。实验结果表明,所提方法的异常流量检测精度高、抗干扰性强,提升了网络流量安全监测能力。关键词:统计向量;支持向量机;网络流量;异常检测;数据降维中图分类号:TP393 文献标识码:BSimulation of Large-Scale Ne
3、twork Traffic Anomaly DetectionBased on Statistical Vector AnalysisCHEN Bo-hong1,ZHU Jin-ming2(1.Xiangsihu College of Guangxi Minzu University,Nanning Guangxi 530225,China;2.School of Materials and Environment,Guangxi Minzu University,Nanning Guangxi 530006,China)ABSTRACT:In order to accurately iden
4、tify the abnormal characteristics of network traffic and reduce the probabilityof malicious attacks,based on statistical vector,this paper presented an algorithm for detecting large-scale networktraffic anomaly.According to network management protocol,we determined the node and network link loads,an
5、dthen obtained a routing matrix of network status and configuration information.After that,we introduced the load val-ue and routing matrix into the generalized regression neural network to extract the traffic features,thus obtaining net-work traffic data in a fixed period.Moreover,we used SplitCap
6、splitter to integrate a group of source IP and target IPof network traffic into the same traffic packet.Meanwhile,every byte in the traffic packet was mapped with the samecharacteristics.Furthermore,we used the t-distributed random neighbor embedding method to calculate theEuclidean distance between
7、 traffic packets,thus reducing the dimension of traffic data and locking the abnormal timerange of network traffic.In addition,we took anomaly detection as a quadratic optimization problem with constraintsand used a support vector machine to calculate the characteristic of the traffic vector.Finally
8、,we used bit compres-sion technology to reduce the data resolution and constructed a network traffic anomaly detection function under thesupport vector machine,thus achieving anomaly detection.Experimental results show that the proposed method hashigh detection accuracy and strong anti-interference
9、ability for abnormal traffic,and improves the security monitoringability.KEYWORDS:Statisticalvector;Supportvectormachine;Networktraffic;Abnormaldetection;Datadimensionality reduction3731 引言网络技术的飞速发展,使得互联网渗透到民生、经济等诸多层面1,成为推进国家发展的源动力2。此外,人工智能、物联网技术的深入研究,也助力了网络服务模式与体验的革新,呈现流量大、多元化的发展趋势,但是与此同时网络环境愈发复杂3,
10、4。为保障网络空间安全,准确鉴别网络流量异常行为是一项亟待处理的重要问题。针对流量异常检测问题,文献5从若干层面获取网络流量特征属性,创建特征属性矩阵,利用数据流之间的相关性组建邻接矩阵,残差计算属性矩阵,依照数据流残差与预设临界值完成流量异常评估。该方法计算量过多,检测耗时较长,实时性不强。除此之外,还有学者提出了基于集成特征选择的网络异常流量检测方法,利用投票机制挑选流量特征子集,采用朴素贝叶斯、决策树、XGBoost 三种机器学习算法进行特征选择择优,输出最佳检测模式完成网络异常流量检测。该方法对应用环境的局限性较高,无法广泛应用在实际场景中。由此,本文提出一种基于统计向量的大规模网络流
11、量异常检测算法。运用广义回归神经网络得到固定时段的网络流量总值,利用 t-分布式随机邻居嵌入方法把高维流量数据变换成低维数据,通过支持向量机统计流量向量特征,代入比特压缩技术实现高精度网络流量异常划分。实验部分从不同角度分析了该方法的可行性,验证了该方法为提升网络安全指数提供了较大帮助。2 大规模网络流量估计为准确获取某个时间段的网络流量总值,展现当前网络状态全局信息,使用广义回归神经网络统计大规模网络流量。流量矩阵代表网络内全部节点之间的流量,链路负载为流量矩阵按照路由矩阵在链路上汇合而成6,7。设定大规模网络包含 a 个节点,c 条链路,那么网络中含有 a2条数据流。则将负载和流量的线性约
12、束条件表示成b(t)=De(t)(1)D=(De)ac(2)式中,D 代表路由矩阵,b(t)为链路负载,e(t)是节点流量,De表示第 e 个路由矩阵包含的数据集。测量简单网络管理协议中的网络节点就能直接得到链路负载,通过网络状态与配置信息获得路由矩阵,只有在确定上述两个值的情况下,才能统计固定时段流量值。大规模网络环境中,链路个数远低于数据流个数,式(1)为一个线性逆向问题,涵盖多个解,挑选最优解的难度较高。本文利用广义回归神经网络良好的非线性特征训练流量统计数据,输出正确率高的流量统计值,给流量异常检测提供完整的数据支持。广义回归神经网络整体架构包含四个层次:输入层、模式层、聚合层与输出层
13、。把广义回归网络中的输入-输出关系记作vi(t)=G(vi(t)|Wj)=kj=1Qjiexp-u(t)-Wj2/22()kj=1exp-u(t)-Wj2/22()(3)式中,vi(t)表示输出值,u(t)为输入值,G 表示神经元数量,Wj、Qji依次表示输入矢量与输出矢量样本,k 代表训练样本个数,是平滑指数。流量矩阵 e(t)与链路负载 b(t)无法直接应用于网络架构训练中,要对其采取数据转换处理,得到满足广义回归神经网络的输入/输出要求的数据,否则训练输出值就不能精准展现流量运行特征8。数据转换处理过程如下u(t)=h(b(t)e(t)=g(v(t)(4)式中,h、g 分别为输入层与输出
14、层的训练迭代次数。将式(4)引入至式(1),将其变换为:e(t)=H(b(t)(5)式中,H 被定义成从 b(t)至 e(t)的映射关联。把式(3)与式(5)拟作训练数据集,通过广义回归神经网络即可得到网络流量统计值。3 网络流量数据降维数据预处理是增强流量异常检测正确率的前提,数据预处理得到的网络流量数据特征,决定了检测结果的可靠性9。当前网络流量数据特征均是高维的,因此,本文设计一种基于 t-分布式随机邻居嵌入(t-distributed stochasticneighbor embedding,t-SNE)的数据降维方法,把高维数据流信息转换成低维数据,有效划分出异常点分布的大致区域,了
15、解网络流量出现异常的时间范围。下面是具体的运算过程:使用 SplitCap 文件分割器把网络流量内一组源 IP 和目标 IP 交互划分至相同流量包内,再格式化流量包获取流量特点10。网络流量包格式化流程为:将流量包内的各字节映射成相同特征,截断各流量包特征,只保存流量包的前 n个字节。t-SNE 算法属于非线性降维,可以把数据从高维空间映射至低维空间。假设一个涵盖 N 个网络流量包的集合是 X=x1,x2,xN,使用 t-SNE 算法计算随机 2 个流量包 xi、xj,把流量包之间的高维欧几里得距离变换成网络流量包之间相似性的条件概率 qj|i,记作qj|i=exp-xi-xj2/()niex
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 统计 向量 分析 大规模 网络流量 异常 检测 仿真 陈波红
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,个别因单元格分列造成显示页码不一将协商解决,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【自信****多点】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【自信****多点】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。