基于范德华力的节点重要性评估算法.pdf
《基于范德华力的节点重要性评估算法.pdf》由会员分享,可在线阅读,更多相关《基于范德华力的节点重要性评估算法.pdf(9页珍藏版)》请在咨信网上搜索。
1、基于范德华力的节点重要性评估算法龚志豪,蒋 沅,代冀阳(南昌航空大学 信息工程学院,南昌330063)摘要 精准度量复杂网络中节点的重要程度有助于研究网络的抗毁性和鲁棒性。为弥补现有算法评估角度片面的局限性,该文将范德华力引入复杂网络中,将网络中的节点映射为分子或原子,并将节点的度值表示为分子或原子的范德华常量,用范德华力来定义节点的影响力,综合考虑节点间路径信息的占比率,提出一种基于范德华力的重要节点挖掘算法VDWF(Van der Waals Force)。该算法兼顾网络的局部信息以及全局拓扑结构等特征。为验证该算法的有效性与适用性,分别采用单调性指标、网络效率以及极大连通系数等作为评估指
2、标,并选取 6 个不同领域的真实数据集与其它算法进行对照实验。结果表明,范德华力算法能够更加有效地挖掘复杂网络中的重要节点,精准区分不同节点的重要性差异。关键词 复杂网络;节点重要性;范德华力;路径占比率 中图分类号 TP311 文献标志码 A doi:10.3969/j.issn.2096-8566.2023.02.001 文章编号 2096-8566(2023)02-0001-09Node Importance Evaluation Algorithm Based on Van der Waals ForceGONG Zhi-hao,JIANG Yuan,DAI Ji-yang(Schoo
3、l of Information Engineering,Nanchang Hangkong University,Nanchang 330063,China)Abstract:Accurately measuring the importance of nodes in a complex network helps to study the resistance to destruction androbustness of the network.To compensate for the limitations of existing algorithms in assessing o
4、ne-sided perspectives,this paperintroduces Van der Waals Force into complex networks.It maps the nodes in the network as molecules or atoms,and represents thedegree of nodes as Van der Waals constants of molecules or atoms.It defines the influence of nodes in terms of Van der WaalsForce,takes into a
5、ccount the percentage of path information between nodes,and proposes a Van der Waals Force-based importantnode mining algorithm called VDWF(Van der Waals Force).This algorithm considers both the local information of the network andthe global topology.To verify the effectiveness and applicability of
6、the algorithm,monotonicity index,network efficiency,and greatconnectivity coefficient are used as evaluation indices.Six real data sets from different domains are selected for control experimentswith other algorithms.The results show that the Van der Waals Force algorithm can more effectively mine i
7、mportant nodes incomplex networks and accurately distinguish the differences in the importance of different nodes.Key words:complex network;node importance;Van der Waals Force;path proportion 收稿日期2023-02-12 修回日期2023-04-03基金项目国家自然科学基金(61663030,61663032);科技部重大研发专项项目(20214ABC28W002);江西省自然科学基金(20224BAB2
8、02028);江西省“双千”项目(jxsq2020102038);南昌航空大学研究生创新专项资金(YC2022-049)通讯作者蒋沅(1982),男,博士,副教授。主要研究方向:复杂系统建模与优化算法。第 37 卷 第 2 期南昌航空大学学报:自然科学版Vol.37 No.22023 年 6 月Journal of Nanchang Hangkong University:Natural SciencesJun.2023 引言近年来,网络信息技术取得了群体性突破,复杂网络已经成为网络科学1中的前沿领域。在各种复杂网络中,对鲁棒性的研究主要是关注移除节点或边后的网络响应情况,而网络如何维持或恢复
9、稳定性决定了其抗毁性。精准地挖掘重要节点有助于网络的鲁棒性与抗毁性研究,并且对于网络的可靠性以及保障网络的正常运行具有重要的现实意义2。例如:识别城市交通网络3中经常发生拥堵的路段并改造完善,可提升交通运行效率、优化出行体验;识别疾病传播网络4中的感染者和超级传播者并进行治疗,可实现多层次全方位避免疫情扩大;识别电力网络5中的各个重要发电厂与变电站并加以保护,可避免变、配电线路受到损坏时造成大面积停电等。针对各种复杂网络研究的背景与意义,广大学者陆续提出各种评价方法以刻画节点的关键程度。早期的典型识别复杂网络节点重要度算法有度排序、K-壳分解法、特征向量中心性、接近中心性和介数中心性等6。其中
10、,度排序算法对网络节点的位置考虑欠缺,因此难以将不同邻居节点的重要程度差异化。时间复杂度较低的 K-壳分解法虽然在网络范围较大时计算速度快,但同一层壳中的节点会被评估为同样的重要程度。而当网络范围较小时,无法进一步精确地评估各个节点之间的重要度差距。特征向量中心性适用于表示各个节点的长期影响力,在传播分析方面具有较大优势。接近中心性和介数中心性等算法应用了网络的全局信息,但没有将节点的局部邻居信息考虑在内,区分度不够精准。为提升评估节点的区分度,杨松青等7综合考察节点的 K-壳中心性与网格约束系数,提出了一种基于 Tsallis 熵的排序算法;Nie等8提出了映射熵来识别网络中的关键节点,该模
11、型兼顾了中心节点相关邻域的局部信息;Yang等9综合了不同角度的中心性标准,提出了一种基于熵权法和 VIKOR 的网络节点重要度排序新方法;Hu 等10提出了节点重要性贡献相关矩阵来识别网络上节点的重要性,该方法考虑了多层和不均匀的节点重要性贡献;韩忠明等11结合节点间三角结构和周围邻居节点,提出了一种基于三角结构的度量模型。结合以上研究,本文将范德华力引入复杂网络中,将网络中的节点视为分子或原子,通过考察每个节点的度值和 2 个节点之间的最短路径距离并将其分别作为范德华常量和距离,综合考虑节点间的路径占比信息,提出一种基于范德华力(Van derWaals Force,VDWF)的指标来识别
12、节点的重要度值。该指标同时兼顾网络的局部信息、节点间的路径信息以及拓扑结构等特征。1 理论基础G=(V,E)V=V1,V2,VnE=e1,e2,emn=|V|m=|E|无向无权的网络拓扑结构。其中是节点集,是边集。节点数,节点间边的条数。1.1 度指标i节点的度定义为与该节点相连的边数,一般来说,若节点的度值越大,则该节点也就越为重要。节点 的度值为:DC(i)=Nj=1aij(1)Naijijaijaij式中,表示该网络中节点的总个数,为节点 和之间的连接状况,若 2 个节点之间有连边,则=1,反之=0。1.2 K-壳分解法K-壳分解法为反复剥离网络中度值小于等于k 的节点。若初始时没有度值
13、为 0 的孤立节点,则首先删除度等于 1 的节点,并将被删除节点的KS 值赋予 1。反复进行以上步骤,直到所有节点都被删除且被赋予 KS 值。1.3 接近中心性接近中心性是指节点到达其他节点的难易程度,假如某个节点越接近其他节点,则该节点向其他节点传播信息越容易。接近中心性为:2 南昌航空大学学报:自然科学版第 37 卷CC(i)=1di=N1Nj=1dij(2)didijij式中,表示某个节点的平均最短路径,为节点和 之间的最短路径距离。1.4 引力模型Li 等12受万有引力的启发,提出了基于引力定律的算法,定义为:SR(i)=dij n 时,O(mn)O(n2)O(n),通常连边数大于节点
14、数。2.2 示例分析图 1 所示网络中节点在各种排序算法下的排名如表 3 所示。其中,DC 算法认为节点 2、节点3 和节点 4 的重要程度较高,但作为多路径选择中的分支,将其重要性排在前会使信息流通容易局限在区域内部,导致传播效率降低,因此,VDWF 算法认为节点 2、节点 3 和节点 4 的重要性排名相对靠后;KS 算法认为节点 1 的重要程度高于节点 5,但若节点 5 被删除,该网络则不再是连通图,故VDWF 算法认为节点 5 的重要性应高于节点 1;CC、SR、VDWF 算法的排名范围较广,但 CC、SR 算法都认为节点 7 的重要性排名较前,而节点6 与节点 9 之间的信息流通若遇到
15、节点 7 所构成的双路径选择,可能会造成其二阶路径处于空置状态,使得节点 7 的重要程度降低;LLS 算法认为边缘节点 8 的重要性高于节点 10 以及节点 11,其他算法均认为节点 8 的重要性低于节点 10 以及节点 11。通过对比,VDWF 算法能够较为准确地评估各节点的重要性,初步验证了 VDWF算法评估节点重要性的有效性与精确性。3 实验网络与评价指标 3.1 实验网络本文在 6 个来自不同领域的网络上进行实验分析,以更加全面地检验 VDWF 算法对复杂网络节点重要度的评估效果。其中 Everglades 为沼泽地网络16,该网络数据集属于生态网络类别。Cannes 为戛纳的对称图案
16、网络17。Combinatorial为模拟组合网络18,该网络描述了多项式方程组数 表 2 不同评估算法的时间复杂度算法类型时间复杂度DCLocalO(n)KSGlobalO(m+n)CCGlobalO(mn)SRHybridO(n2)LLSLocalO(n)VDWFHybridO(n2)1110123456789 图 1 示例网络 4 南昌航空大学学报:自然科学版第 37 卷字用于模拟组合的问题。Electrophoresis 为 DNA电泳网络19,这是由聚合物中的 7 个单体扩散而成的网络。Matrix 为马尔可夫链转换矩阵网络20。Power 为电力网络21。6 个不同领域网络数据拓扑
17、特征的统计数据如表 4 所示。其中的 N、E、D、和 分别表示整个网络当中的节点个数、边数、密度、平均度值和平均聚类系数。表 4 6 个网络拓扑特征的统计数据网络NEDEverglades699110.388 321260.584 24Cannes1445760.055 94480.740 38Combinatorial2045350.025 83750.024 82Electrophoresis34030840.047 614160.246 80Matrix49618590.016 29170.362 58Power68519670.005 47230.172 47 3.2 评价指标为验证
18、VDWF 算法的准确性,本文分别从网络的鲁棒性、抗毁性以及排序算法的分辨率等方面进行节点重要度评价实验,采用了单调性指标、网络效率和极大联通系数等评估指标,并将其结果与基于局部信息的度排序(DC)、基于节点位置信息的 K-壳分解法(KS)、基于最短路径的接近中心性(CC)、基于邻域和路径信息的引力模型(SR)以及基于度和邻居节点间的拓扑重合度的邻域相似度(LLS)等指标作对比。M(R)定定义义 1 单调性指标可良好地量化不同排序方法的分辨率,其计算公式为:M(R)=1rRnr(nr1)n(n1)2(9)nrR0,1M(R)式中:表示具有相同关键程度值的节点数量;表示根据不同排序方法得到的排名向
19、量大小;单调性指标量化了排名列表中并列的比例,其取值范围为,若 排 名 向 量 完 全 单 调,则 单 调 性 指 标=1。定定义义 2 网络效率 E 即为节点间距离倒数的平均值,即:E=1N(N1)1ijN1dij(10)iEiE式中:设删除节点 后,剩余网络效率为;网络效率体现了传播能力方面网络抗毁性的强弱,网络效率 越小,说明网络抗毁性越弱、攻击效率越强。Ci定定义义 3 极大连通系数 定义为删除节点 后网络的最大连通分支规模与网络原始规模之比,即:C=NiRN(11)NiRiC式中:表示节点 删除后最大连通分支中的节点数;极大连通系数体现了拓扑结构方面网络抗毁性的强弱,极大连通系数 值
20、越小,说明网络抗毁性越弱、攻击效率越强。定定义义 4 SIR 模型中节点的影响力为传播结束时免疫个体 R 的规模。除免疫个体 R 以外,模型中还有易感染个体 S 以及感染个体 I。其中,免疫个体 R 被治愈后拥有免疫能力,因此该类节点即不会传染,也不会被感染。实验起始时,只有少数感染节点 I,剩余均为易感染节点 S。每个时间步 表 3 示例网络中节点的排名排名1234567891011DCV5V6V9V1V2V3V4V7V10V11V8KSV1V2V3V4V5V6V7V9V10V11V8CCV6V5V9V7V2V3V4V1V10V11V8SRV6V5V9V1V7V2V3V4V10V11V8LL
21、SV6V9V5V2V3V4V1V7V8V10V11VDWFV9V5V6V1V10V11V2V3V4V8V7 第 2 期龚志豪,蒋 沅,代冀阳:基于范德华力的节点重要性评估算法 5 长里,感染节点 I 以感染率 去感染周围的易感染节点 S,并且以恢复率 成为免疫节点 R。直到网络中没有新增的感染节点 I 时实验结束,此时的感染节点 I 数量越多,说明起始时的少数感染节点的传播能力越强。4 仿真实验 4.1 单调性指标分析不同排序算法在 6 个网络中的单调性指标如表 5 所示。可以看出,VDWF 算法在 6 个网络中均具有良好的区分度,并且在Everglades、Combinatorial以及 M
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 基于 范德华力 节点 重要性 评估 算法
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,个别因单元格分列造成显示页码不一将协商解决,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【自信****多点】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【自信****多点】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。