基于SDN的数据中心网络流量负载均衡研究.pdf
《基于SDN的数据中心网络流量负载均衡研究.pdf》由会员分享,可在线阅读,更多相关《基于SDN的数据中心网络流量负载均衡研究.pdf(8页珍藏版)》请在咨信网上搜索。
1、基于 SDN 的数据中心网络流量负载均衡研究王灵矫1,2*,李文1,2,郭华1,2(1.湘潭大学自动化与电子信息学院,湖南湘潭411105;2.湘潭大学智能计算与信息处理教育部重点实验室,湖南湘潭411105)摘要:目前数据中心网络(datacenternetwork,DCN)的负载均衡方法存在对大小流的调度缺乏全局实时检测等不足,部分大流会造成拥塞、负载不均衡和带宽碎片等问题.针对上述问题,提出了一种 SDN 网络流量负载均衡算法DSA-D.首先,对流量进行分类,为大流计算所有源至目的主机可达路径的最短跳数路径集;然后,根据 LLDP 和 ECHO 测量链路时延以求得时延最优路径集;最后,采
2、用概率拟合算法分配路径,实现数据中心网络流量负载均衡.在相同场景下的实验结果表明,与 ECMP、Hedera 和 DIFF 算法相比,DSA-D 算法具有更好的吞吐量、链路带宽利用率和平均往返时延.关键词:软件定义网络;数据中心;时延优化;负载均衡中图分类号:TP393文献标志码:A文章编号:02587971(2024)01004508软 件 定 义 网 络(software-defined networks,SDN)1-2实现了转发平面与控制平面的分离,具有可编程、集中控制和自动化等特点.集中控制的特点适用于数据中心,数据中心网络(datacenternetwork,DCN)的规模随着各种云
3、服务的发展越来越大,信息服务的集约化和专业化使互联网上的应用、计算和存储向数据中心迁移容易出现故障、拥塞等问题.网络的大部分流量为持续时间很短的小流,Benson3等对数据中心的实测数据显示,80%以上的流量为小流,不到 20%的大流却包含了超过 90%的数据流量,承载大量数据的大流是造成网络拥塞的主要原因.近年来,大量的研究都聚焦于大小流的检测和调度.文献 4 针对 DCN 的具体拓扑和流量特性,提出了一种基于 SDN 的流量调度方法,对源目地址相同的大流进行聚合,利用改进的果蝇优化算法对聚合后的大流统一调度,该方法时间复杂度较高.文献 5 给出一种细粒度流分类方法,通过预分类和精确分类两层
4、结构的二分类方案来检测大/小流,但该方法缺乏对分类后的算法设计.文献 6提出了一种针对大流的低成本的流调度框架,轮询周期根据实时网络负载动态调整,但该方法未考虑时延.文献7 采用差异化的调度算法DIFFERENCE,使用加权多路径路由算法调度小流,根据链路利用率调整路径权值,提出一种基于阻塞岛的大流路径设置算法,实现更小的空间找到最不拥塞的路径.文献 8 使用经典的多协议标签交换(multi-pro-tocollabelswitching,MPLS)技术聚合多路径流后传输,比传统的 OpenFlow 更能有效减少交换机的流条目数量,提高了处理效率,但该方法可能会导致新的拥塞.文献 9 对 SD
5、N 网络进行拥塞感知和流量调度研究,提出了基于链路利用率样本方差的流量分配优化模型,采用了混沌遗传算法求解这一 NP 难问题,但该方法的量化指标单一,仅对带宽利用率寻优.文献 10 提出了一种可扩展的动态流调度系统 Hedera,能自适应地调整多级交换结构和有效地利用聚合的网络资源.文献 11 针对 SDN中基于动态多路径的流量管理方法提出估计端到端延迟并计算最小成本路径,将流量重新路由到最佳路径.文献 12 提出一种基于多路径传输的动态路由算法,重新定义链路关键度并求解链路权值优化问题,该算法复杂度较高.传统的等价多路径路由(equalcostmulti-path,ECMP13-14)算法没
6、有拥塞感知机制不能实时获取链路状态,可能会将多个大收稿日期:2022-09-14;接受日期:2022-12-10;网络出版日期:2023-02-06基金项目:国家自然科学基金(61771414).*通信作者:王灵矫(1971),男,四川人,博士,副教授,主要研究移动性管理技术、WiMAX 技术和无线传感器网络.E-mail:xtu-.云南大学学报(自然科学版),2024,46(1):4552JournalofYunnanUniversity:NaturalSciencesEditionDOI:10.7540/j.ynu.20220465流调度到同一条链路导致拥塞.未充分考虑链路实时状态,若数据
7、中心的流量短期内出现随机波动,可能会造成大流碰撞出现路径拥塞等问题,影响网络性能.目前大量研究对于时延的测量精度较为粗糙,可能影响实际最优路径的选取.全局最佳拟合算法(globalbestfitalgorithm,GBFA)作为一种贪婪启发式算法,处理大部分流量时表现良好.但在大多数流量不够大的情况下,GBFA 会导致一些路径被小流占据,而其他路径处于空闲,造成链路存在大量的带宽碎片.针对数据中心网络流量负载不均衡问题,本文给出了一种基于 SDN 流量的时延调度算法(dyna-micschedulingalgorithm-delay,DSA-D).其基本思想是基于跳数,利用精确的路径时延从最短
8、路径集中筛除部分次优路径.针对 GBFA 易造成带宽碎片浪费带宽资源的问题,本文将链路可用带宽与流带宽需求作为权重引入 GBFA,提升流量负载均衡准确性和效率.由于大流对带宽要求高,算法主要对大流进行调度计算,小流则采用 ECMP 计算下发路径.本文主要的贡献如下:(1)根据性能参数跳数、时延和可用带宽,提出基于 SDN 的 DSA-D 流量负载均衡方法为数据流寻找最优转发路径;(2)提出基于时延的最优路径模型,通过周期下发的 LLDP 和 ECHO 报文来探测链路时延,计算链路精确时延,利用时延最优路径算法求解流量下发路径;(3)提出将 GBFA 算法与概率方法相结合的概率拟合(GBFA-P
9、)算法,考虑了路径可用带宽和流带宽需求,提高了吞吐量并减少带宽碎片;(4)基于 Ryu 控制器实现了 DCN 流量负载均衡的相关实验,结果表明:在相同场景下,DSA-D比 ECMP、Hedera 和 DIFFER 提高了平均吞吐量、链路带宽利用率,降低了平均往返时延.1分析与建模1.1问题描述Fattree15是一种经典的拓扑结构,原型为 Clos 架构,具有较优的网络故障恢复能力和拓展能力以及通信带宽,被研究界广泛使用.图 1 展示了一个 K=4(K 为每个交换机的端口数或Pod 的个数)的 Fattree 结构.若采用 ECMP 转发,可能会产生冲突,导致交换机过载或链路拥塞(如图 1 所
10、示的由 ECMP 采用哈希方法导致的局部冲突).网络负载均衡需要完成两项主要工作:检测数据流的大小;设计有效的调度算法计算路径,提高负载均衡度.1.2基于 DSA-D 的流量负载均衡技术1.2.1 框架介绍负载均衡框架由链路和时延探测模块、流量分类模块、流量调度模块 3 部分构成.基于 DSA-D 的流量负载均衡框架如图 2 所示.链路和时延探测模块周期调用控制平面与数据平面之间的南向协议接口,获取 OpenVSwitch 交换机各个端口的统计数据.流量分类模块根据接口统计数据对流量的速率检测后进行分类.流量调度模块结合当前网络状态及流的需求,为流量计算最优下发路径.1.2.2 符号定义网络拓
11、扑图表示为 G(V,E),V表示交换机节点集合,E 表示交换机边的集合,V=v1,v2,vM,E=e1,e2,eN,M 为网络的交图1ECMP 算法可能导致的网络冲突Fig.1PossiblenetworkconflictscausedbyECMPalgorithm46云南大学学报(自然科学版)http:/第46卷换机总数,N 为总边数,u、v(uv)表示任意两个交换机节点,eij表示节点 i 和 j 之间的链路,链路带宽为B.G(V,E,t)表示在时间t 时的网络图,tt1,t2,tTc,Tc为探测周期.1.2.3 流量分类根据数据中心网络流量特征,采用基于流采样的检测方法16,传输速率超过
12、链路容量的 10%定义为大流,并新增一个流生存时间避免流条目生存时间过短影响计算,流量传输速率计算如下.(1)流生存时间:ft=ft2 ft1,(1)式中:ft1和 ft2分别为流采样的两个时刻.(2)流生存时间限制:fl=ft,ft 0.1,0.1,ft 0.1.(2)(3)流传输的字节数:fb=bc.ft1bc.ft2,(3)式中:bc.ft1和 bc.ft2为 ft1和 ft2时刻交换机端口统计传输的字节数.(4)流传输速率:fs=fb8/(ftB1 000),(4)式中:fb为流传输的字节数,B 为链路容量.(5)流分类:fsize=大流,fsB 10%,小流,fsB 10%.(5)2
13、流量负载均衡算法DSA-D 算法DSA-D 算法通过结合 GBFA 与路径可用带宽及流带宽需求,调度前对流量进行分类,从最短路径中利用路径时延筛除部分次优路径,将可用带宽与流带宽需求作为分配权重,实现吞吐量和链路利用率的提高.DSA-D 算法的基本流程图如图 3 所示,主要包括最短路径初筛、时延最优路径筛选、GBFA-P概率拟合算法分配路径 3 个阶段.图3DSA-D 算法基本流程图Fig.3BasicflowchartofDSA-Dalgorithm2.1最短路径初筛网络链路的状态信息会实时变化,而在网络状态没有异常情况下基于跳数的网络路由相对稳定.在复杂网络中,如果频繁更新路由会导致计算成
14、本增高,考虑成本和开销,本文将跳数作为初步筛查指标.首先计算源主机和目的主图2基于 DSA-D 算法的流量负载均衡框架Fig.2TrafficloadbalancingframeworkbasedonDSA-Dalgorithm第46卷王灵矫等:基于 SDN 的数据中心网络流量负载均衡研究47机的最短路径集合,定义每个流的一个 3 元组信息,分别为源 IP,目的 IP,流量的带宽需求 fc,采用 KSP算法寻找 k 最短路径集.为防止无效查找,限制其路径跳数不超过设定的阈值 H.其约束如:Mu=1Mv=1f(u,v)H.(6)此外,流量的带宽需求应小于被选择路径的剩余带宽,约束如:f(u,v)
15、fc b(u,v),(7)式中:b(u,v)为链路 e(u,v)的剩余带宽.除了接入层交换机节点以外,网络结构的所有节点的出流量等于入流量,如:Mu=1Mv=1f(u,v)e(u,v)bi=Mv=1Mu=1f(u,v)e(u,v)bi,(8)式中:f(u,v)为布尔变量,若 u,v 之间存在链路则f(u,v)=1,否则 f(u,v)=0.2.2时延最优路径筛选将筛选后的最短跳数路径集进行时延探测,计算链路的真实时延 Tt(u,v),时延探测分别为 LLDP 和 ECHO 探测,如图 4 所示.图4LLDP 和 ECHO 时延探测原理图Fig.4SchematicdiagramofLLDPand
16、ECHOdelaydetectionT1T2LLDP 探测过程:控制器下发含有发送时间戳的 LLDP 探测数据包,控制器收到返回的 Packet/in请求并解析 LLDP 数据包,获得发送时间节点计算 LLDP 时延.LLDP 报文的发送与收到时间之差为图 4 红色虚线和实线组成的 123 循环;反向的数据包发送与接收时间差为图 4 黑色虚线和实线组成的 456 循环.ECHO 探测过程与 LLDP 时延探测相似,控制TaTaTb器发送含有发送时间戳的 ehco/request 探测数据包,控制器解析交换机返回的 echo/reply 报文.ECHO报文的发送与接收时间之差为为图 4 黑色椭圆
17、包围的红色虚线 1 和黑色虚线 6,是控制器与交换机 A 的 ECHO 时延;同理控制器与交换机 B 的ECHO 时延为为图 4 红色椭圆包围的黑色虚线4 和红色虚线 3.假设链路的往返时延相等,Tt(u,v)可表示为:Tt(u,v)=(T1+T2TaTb)12.(9)为了保证时延探测的有效性,对LLDP 和ECHO探测时间进行限制,如下所示.Tl(u,v)(t)Tl,(10)Te(u,v)(t)Te,(11)TlTeTl(u,v)(t)Te(u,v)(t)式中:和为 LLDP 和 ECHO 探测周期,和为 LLDP 和 ECHO 实际探测时间.网络的状态是实时变化的,为了求出 k/2 最优传
18、输时延路径集,研究某一探测周期内的 k/2 最优传输时延路径,最小化传输时延可写成mink/2k=1Mu=1Mv=1Tt(u,v)f(u,v),(12)式中:Tt(u,v)为在 t 时刻链路 e(u,v)的时延.通过上述步骤可得到一个由时延优先级构成的路径集 p=p1,p2,pk/2,用概率拟合算法对路径集 P 进行处理,实现流量负载均衡的目的.2.3概率拟合算法(GBFA-P)用改进的 GBFA-P 算法对 k/2 时延最优模块的路径集进行计算,采用 GBFA 算法和概率方法消除带宽碎片.假设源目地址之间经过跳数和时延最优路径筛选得到路径集 p=p1,p2,pk/2,第 i 条路径 pi=p
19、i1,pi2,pix,由 x 条链路组成.令 Pb表示第 pi条路径源目地址间的剩余可用带宽,可表示为:Pb=minjx(Bbij),(13)式中:B 为链路容量,bij为路径 pi上第 j 条链路的已用带宽.假设网络存在 y 条数据流 y=f1,f2,fc,fy,有 n 条不同的路径可以容纳数据流 Fc,用 ri表示第 i 条可选路径剩余带宽(Pb)与流的带宽需求(fc)之比.可表示为:ri=Pbfc.(14)48云南大学学报(自然科学版)http:/第46卷最终得到第 i 条路径被选择的概率计算公式为:p(i)=1rinj=11rj.(15)在一个时间周期内,流的所有候选路径剩余带宽都是确
20、定的,概率拟合算法的关键是根据流的剩余带宽和带宽需求的比值分配路径的选择概率.候选路径被选中的概率与其剩余带宽成反比,剩余带宽与带宽需求差值越小,被选择的概率越大.2.4DSA-D 算法总结DSA-D 算法步骤如下:步步骤骤 1接收来自流量分类模块的大小流,若为小流,则通过 ECMP 分配转发路径,否则继续步骤 2;步步骤骤 2若为大流则请求控制器调用链路拓扑信息,计算 k 最短跳数路径集.并进入步骤 3;步步骤骤 3根据步骤 2 得到的 k 最短跳数路径集合,对集合中的链路进行 LLDP 和 ECHO 时延探测,进入步骤 4;步步骤骤 4计算链路的精确时延,采用时延最优算法寻找 k/2 时延
21、的最优路径集;步步骤骤 5将流带宽需求与链路可用带宽的比值作为权重,GBFA-P 结合权重选择最佳路径,控制器按所选路径下发流条目.DSA-D 算法引入 LLDP 和 ECHO 时延探测,利用链路时延对路径优先级排序,提高了筛选指标的精度;GBFA-P 对最优时延路径计算其剩余带宽,分配方案结合了概率方法,可以消除一定的带宽碎片,提高链路利用率和吞吐量.3仿真实验3.1仿真环境本文在 Linux 系统上使用 Ryu 控制器实现了 DSA-D 算法,使用 mininet 模拟 SDN网络环境,采用 Iperf 软件模拟发包测试算法.主机配置为 2.40GHz,8GiB 内存 CPU,操作系统为U
22、bantu14.04.在如图 1 所示的 4-PodFattree 网络拓扑中,核心层交换机的 n 个端口分别连接到每个 Pod 的某一个汇聚层交换机.设置 KSP 算法的候选路径k=12,链路拓扑探测周期 Tc为 2s.链路带宽为10Mibit/s,使用 Iperf 发包测试,每组实验测试时长 60s.仿真使用 2 种流量模式:(1)Random:每台主机以相同的概率向其他主机发送数据;(2)Stag(EdgeP,PodP)17:主机以概率 EdgeP发送到同一接入交换机中的另一个主机,称为 Pod内流量.以概率 PodP 发送到相同的 Pod 且不在同一接入交换机的主机.以概率 1-Edg
23、eP-PodP 发送到网络的其余部分.采用一组随机模型和最接近数据中心的 4 种流量模型进行发包测试,每组重复 20 次,每种流量模型结果取平均值:random、stag_0.5_0.3、stag_0.6_0.2、stag_0.7_0.2、stag_0.8_0.1.3.2性能评估指标实验比较 DSA-D 与 ECMP、Hedera 和 DIFFER 算法,性能评估指标主要包括平均吞吐量(Ca)、链路带宽利用率(Bu)、平均往返时延(Td)3 个指标.(1)平均吞吐量网络系统在当前流量模型下获得的吞吐量的平均值,表示如下:Ca=ni=1Cin,(16)式中:Ci为路径 Pi的吞吐量,n 为路径总
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 基于 SDN 数据中心 网络流量 负载 均衡 研究
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【自信****多点】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【自信****多点】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。