基于改进灰色聚类算法的云架构数据中心网络异常流量过滤算法.pdf
《基于改进灰色聚类算法的云架构数据中心网络异常流量过滤算法.pdf》由会员分享,可在线阅读,更多相关《基于改进灰色聚类算法的云架构数据中心网络异常流量过滤算法.pdf(9页珍藏版)》请在咨信网上搜索。
1、 研究与开发 基于改进灰色聚类算法的云架构数据中心 网络异常流量过滤算法 周雪峰1,徐强2,谭艳婷3,郎嘉忆1,经航1,赵志强2(1.国家电网有限公司客户服务中心,天津 300309;2.北京中电普华信息技术有限公司,北京 100031;3.北京国网信通埃森哲信息技术有限公司,北京 100052)摘 要:为避免异常流量影响云架构数据中心网络安全运行,需要对云架构数据中心网络异常流量进行过滤。异常流量在不同信噪比和信道条件下过滤难度不同,为了在不同过滤条件下保障异常流量过滤效果,提出了基于改进灰色聚类算法的云架构数据中心网络异常流量过滤算法。通过时间频率分析构建了云架构数据中心网络流量传输模型,
2、采集网络流量序列;引入加权广义距离改进灰色聚类算法,利用改进的灰色聚类算法计算网络流量序列特征最佳聚类结果,实现流量序列特征提取;通过主成分分析法获取流量序列特征的主分量特征值,构建两个子空间,将流量特征以矩阵方式映射到两个子空间中;根据映射周期向量的平方预测误差与阈值计算结果,过滤异常流量。实验结果表明,该算法可通过聚类实现数据中心网络流量序列特征提取,在不同信噪比和信道条件下有效过滤异常流量;当网络信噪比为 25 dB 且流量在高斯信道中传输时,异常流量过滤效果更突出。关键词:改进灰色聚类;云架构;数据中心网络;异常流量;加权广义距离;主成分分析 中图分类号:TP393 文献标志码:A d
3、oi:10.11959/j.issn.10000801.2023137 Cloud architecture data center network abnormal traffic filtering algorithm based on improved grey clustering algorithm ZHOU Xuefeng1,XU Qiang2,TAN Yanting3,LANG Jiayi1,JING Hang1,ZHAO Zhiqiang2 1.State Grid Customer Service Center,Tianjin 300309,China 2.Beijing C
4、hina-Power Information Technology Co.,Ltd.,Beijing 100031,China 3.Beijing SGITG Accenture Information Technology Center Co.,Ltd.,Beijing 100052,China Abstract:To avoid abnormal traffic affecting the safe operation of the cloud architecture data center network,it was necessary to filter the abnormal
5、traffic of the cloud architecture data center network.The difficulty of filtering ab-normal traffic varies under different signal-to-noise ratios and channel conditions.In order to ensure the filtering effect of abnormal traffic under different filtering conditions,a cloud architecture data center n
6、etwork abnormal traf-fic filtering algorithm based on improved grey clustering algorithm was proposed.A network traffic transmission model was built for cloud architecture data centers through time-frequency analysis,and network traffic sequences 收稿日期:20230309;修回日期:20230630 91 电信科学 2023 年第 7 期 were
7、collected.Weighted generalized distance was introduced to improve the grey clustering algorithm,and the im-proved grey clustering algorithm was used to calculate the optimal clustering results of network traffic sequence features,achieving traffic sequence feature extraction.The principal component
8、eigenvalues of traffic sequence features were ob-tained through principal component analysis,two subspaces were constructed,and traffic features were mapped in a ma-trix manner to the two subspaces.Abnormal traffic was filtered based on the square prediction error of the mapping pe-riod vector and t
9、he threshold calculation results.The experimental results show that this algorithm can achieve feature extraction of data center network traffic sequences through clustering,effectively filtering abnormal traffic under differ-ent signal-to-noise ratios and channel conditions.When the signal-to-noise
10、 ratio of the network was 25 dB and the traffic was transmitted in a Gaussian channel,the filtering effect of abnormal traffic was more prominent.Key words:improved grey clustering,cloud architecture,data center network,abnormal traffic,weighted generalized distance,principal component analysis 0 引言
11、 数据中心是依托计算机技术与网络技术建设的重要基础设施,在互联网技术不断成熟的今天,更多企业将其开发的应用部署于数据中心中,以期实现数据的高效传输与存储1。随着云计算技术的高速蓬勃发展,数据中心普遍采用云架构模式实现大规模数据的保存与计算。目前,云架构数据中心网络规模呈连年增长趋势快速发展,网络流量也不断提升2。数据中心网络流量既有随机性较强、对传输时延敏锐的小数据流,也有对吞吐要求高且持续周期久的大数据流3-5,数据中心网络运行过程中,遭受黑客攻击可能导致网络流量发生异常,使得网络的正常运行受到影响,甚至造成严重后果。采取有效手段对数据中心网络异常流量进行过滤,是保证网络安全、平稳运行、避免
12、经济损失的重要措施6-8。谢燕等9基于软件定义网络(software defined network,SDN)技术对数据中心网络异常流量进行检测。基于 SDN 框架设计数据流量传输过程,利用模糊 c-均值聚类算法、反向传播神经网络算法提取数据流量特征,利用主成分分析法建立流量特征子空间,根据采用设定阈值实现网络流量的异常检测。该方法获取的流量特征维度过高,增加了算法的计算难度,导致算法检测效果不佳。段雪源等10提出基于多尺度特征的网络流量异常检测方法。采用多尺度滑动窗口划分原始流量序列,利用小波变换和特征空间映射重构多层序列,采用加权投票策略完成网络流量异常的判定。但该算法未对数据关联进行精准
13、分析,异常流量过滤效果并不理想。数据中心网络流量特征较多,但并非所有特征均与流量的异常状态具有强关联性,灰色聚类算法能够对各因素间的不确定性关系进行分析,通过相似或差异大小反映各因素关系的强弱11-12。本文提出基于改进灰色聚类算法的云架构数据中心网络异常流量过滤算法,通过引入加权广义距离实现灰色聚类算法的改进,以改善异常流量过滤效果,确保数据中心网络的安全、可靠运行。1 云架构数据中心网络异常流量过滤 1.1 云架构数据中心网络流量传输分析 云架构数据中心网络是通过若干条链路实现大量交换机相连,并且能够提供云计算等服务的大型通信网络。其拓扑结构包含核心层、聚合层、基础层 3 个部分,拓扑结构
14、中全部交换机均相连后构成交换机集群,聚合层设备通过核心层交换机与数据中心网络服务器建立数据通信通道13-15,实现数据流量的传输。云架构数据中心网络异常流量过滤的前提是确定流量传输模型完成对网络流量的采集。云架构数据中心网络的流量传输过程如图 1 所示。研究与开发 92 图 1 云架构数据中心网络的流量传输过程 当簇首节点发送信息后,由数据块(Chunk)与数据中心进行交互,实现内存块(Slice)数据的获取,由流量存储池完成异常流量特征分析以及网络流量数据的收取与发送16-18。由于云架构数据中心网络在数据通信过程具有多输入输出性,并且呈现三维连续性,因此,本文通过时间频率分析确定数据中心网
15、络流量传输模型,其表达式描述为:cc2()2()()Re()e()enftftnlnx ta ts tt(1)在云架构数据中心网络中,流量传输的时间尺度脉冲响应可通过式(2)描述。c2()(,)()e()nftnlnncta ts tt(2)其中,第n条数据中心网络传输链路t时刻网络流量主频特征表示为()na t,该链路上的流量传输时延为()nt、链路调制频率为cf、单分量传输数据为()ls t。在云架构数据中心网络中,通信节点可通过P条传输链路进行数据传输19,多链路流量传输函数可通过式(3)描述。1()()Piiih tb P t(3)其中,云架构数据中心网络流量在传输过程中产生的损失表示
16、为ib,链路传输时延为i。该网络的流量传输函数表达式为:00020()()(,)(,)()()e(,)(,)yxv tyxy tx ttW t vW tt vy tx tW t vW t vv(4)对流量特征分布空间作重构处理后,可实现数据中心网络流量传输过程的分析,可以描述为:12()(),0y tk x kt k(5)(,),yxvW t vWktk(6)其中,传输开始时刻为0t,网络流量采集频率为k,云架构数据中心网络带宽和初始带宽分别为v、0v,时间窗口函数表示为xW,在数据传输链路中,流量时间序列的时、频域伸缩尺度为()y t、(,)yW t v。1.2 基于改进灰色聚类算法的异常流
17、量特征提取 云架构数据中心网络在流量传输过程中,不可避免地会产生网络拥堵、攻击等异常问题,实时监控数据中心网络流量,并对异常流量进行过滤处理是确保网络安全、可靠的有效措施20-22。引起数据中心网络流量发生异常的原因较多,异常流量特征为时变性强、任意性高,因此,本文采用灰色聚类算法对数据中心网络的流量特征进行聚类,引入加权广义距离对算法进行改进处理,以最小加权广义距离平方和作为优化目标,实现异常流量特征最佳聚类结果的确定,从而完成数据中心网络异常流量特征的提取。1.2.1 灰色关联度 数据中心网络流量发生异常的原因不一,通过不同因素间的类似性和差异性反映各因素的趋近关系是灰色关联分析的主要思想
18、23-24。用01,imXXXXX描述数据中心网络流量序列,总数量为m,数据中心网络中的一个随机93 电信科学 2023 年第 7 期 流量序列为()1,2,jjXx u uN,该流量序列由N个特征构成,将之作为对比流量序列,通过0X 0()1,2,x u uN描述网络流量参考序列。在对参考流量序列与对比流量序列特征的邓氏灰色关联度计算前,先对网络流量特征差序列j(u)进行确定,具体如下。0()()()jj ux ux u(7)maxmax()j u(8)minmin()j u(9)其中,两极最大差为max、最小差为min。j用于描述u时刻流量序列特征的邓氏灰色关联系数,其表达式为:minma
19、xmax()jj u(10)其中,分辨因子为,其取值区间为(0,1),分辨性能与值成反比关系,为能准确过滤数据中心网络的异常流量,需要使数据中心网络异常流量特征分辨能力尽可能大,故适合取较小值。数据中心网络流量序列特征0 x、jx的邓氏关联度表达式为:10(,)Njujr x xN(11)数据中心网络流量序列间的关联性可通过0(,)jr x x关联度值的高低衡量。数据中心网络含有的流量序列数量为m,每个流量序列的特征数量为N,网络流量序列iX与其他流量序列间的关联度为12(,)iiiimrr rr,对其进行排序即可完成关联度矩阵的确定,可描述为:11111122121212.mmmmmmmrr
20、rrrrrrrrrrR(12)建立关联度矩阵 R 时,将阈值设定为0.90,当两网络流量序列特征间的关联度高于0.90时,则将其归并为同一类。1.2.2 改进灰色聚类算法的数据中心网络流量特征提取 确定数据中心网络m个流量时序数据的关联度矩阵后,采用改进灰色聚类算法依据关联度矩阵中各个项的取值提取数据中心网络流量序列特征25。改进灰色聚类算法通过引入加权广义距离描述数据中心网络流量序列iX与初始聚类中心zm间的相似度大小,提高数据中心网络流量特征的提取效果,加权广义距离描述为:(,)(,)ziziziqd mXr mX(13)其中,数据中心网络流量序列iX与初始聚类中心zm间的关联度为(,)z
21、ir mX,流量序列iX与聚类中心zm间存在的差异性可通过ziq结果进行量化,且11Hzizq,初 始 聚 类 中 心 总 数 为H。计 算(,)zid mX的平方和,将其最小值作为优化目标,以获取最优数据网络中心流量特征聚类结果,优化目标描述为:2112211min()(,)1min(,)mHziziizmHziiizixf qd mXqr mX(14)依据式(14)建立拉格朗日函数,则有:211122111min()(,)11min1(,)mHHziziziizzmHHziziiizzif qd mXqqqr mX (15)对kiq及拉格朗日系数作偏导运算,使其结果为0,则有:21(,)2
22、(,)0(,)10ziziziziHzizizqqr mXqqq (16)研究与开发 94 21(,),1Hzizizizqr mXq(17)由 此 可 确 定,211(,)Hzizr mX,211(,)(,)ziHhizziqr mXr mX,其中,hm为聚类中心。为取得数据中心网络流量特征的最优聚类结果,需要确定初始聚类中心循环规则,即在满足限定条件11Hzizq的情况下,使式(18)成立。22221111min(,)()mHmHziziziiaizizqd mXqXV (18)其中,距离范式表示为()iaXV,新聚类中心表示为aV,利用拉格朗日乘数法可实现新聚类中心aV的确定,其表达式描
23、述为:2121()()maiiiamaiiqxVq(19)在提取数据中心网络流量特征时,需要先确定全部网络流量序列与各聚类中心相似度,再通过式(19)不断更新聚类中心,当满足收敛条件后算法停止,以此实现数据中心网络流量特征的提取。1.3 数据中心网络异常流量过滤 获取数据中心网络流量特征聚类结果后,将其作为维度为tp的流量矩阵 E 的输入,通过主成分分析法完成其前g个主分量特征值的获取,确保累积贡献率达到95%以上,由提取的特征向量完成流量特征子空间c的构建,其维度为pg,未被提取的流量主分量特征向量数量为pg个26-27,由其构成子空间c,其维度为()ppg。在流量矩阵 E 中,正常特征值均
24、分布在子空间c中,而子空间c中的皆为异常流量特征值。将流量矩阵 E 映射到子空间c、c中,在某一时间周期内,矩阵 E 的映射周期向量表示为,其表达式描述为:(20)其中,在子空间c中的映射向量为,即数据中心网络的正常流量;在子空间c中的映射向量为,用于描述残差流量,由c子空间g个流量特征向量组合而成的矩阵表示为O,通过式(21)确定、。TT(1)OO OO(21)确定后,判断与标准残差流量值的差异即可实现数据中心网络异常流量检测并将其过滤,本文引入平方预测误差对e进行分析,可得到:22TSP(1)FOO(22)的平方预测误差用SPF描述;数据中心网络异常流量过滤阈值为2,通过式(23)计算获得
25、。0122000(1)2hiiiih hCh(23)其中,数据中心网络正常流量权值为0h;高斯分布中1分位数值表示为C,具有高斯分布特征。i是流量分布状态系数:1piii g (24)其中,网络流量的第i个特征值为i。当2SPF时,则判断该流量为异常流量,并将其过滤,实现数据中心网络异常流量过滤。2 实验分析 以某企业云架构数据中心网络为研究对象,从其中心交换机获取网络流量序列构建流量样本数据集,每5 min为一个采样周期,以10 kHz的采样频率对流量序列样本进行采集。其中含有正常流量样本8 000条,异常样本为拒绝服务(denial of service,DoS)、从远程到本地(remot
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 基于 改进 灰色 算法 架构 数据中心 网络 异常 流量 过滤
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,个别因单元格分列造成显示页码不一将协商解决,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【自信****多点】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【自信****多点】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。