广义多粒度粗糙集特征选择算法研究.pdf
《广义多粒度粗糙集特征选择算法研究.pdf》由会员分享,可在线阅读,更多相关《广义多粒度粗糙集特征选择算法研究.pdf(9页珍藏版)》请在咨信网上搜索。
1、随着信息技术的迅猛发展,产生了大量的数据,这些数据体量巨大、形式多样、产生迅速、价值密度低、随着信息技术的迅猛发展,产生了大量的数据,这些数据体量巨大、形式多样、产生迅速、价值密度低、商业价值高。如何使这些数据对人类社会的进步产生积极影响是一个难题。粗糙集理论可以直接对数据商业价值高。如何使这些数据对人类社会的进步产生积极影响是一个难题。粗糙集理论可以直接对数据进行降维处理,发现数据中的隐含知识,促进社会进步。经典粗糙集理论基于单个二元关系,缺乏灵活进行降维处理,发现数据中的隐含知识,促进社会进步。经典粗糙集理论基于单个二元关系,缺乏灵活性和普遍性,基于多个二元关系的粗糙集理论可以解决上述难题
2、,因此,本文主要针对广义多粒度粗糙性和普遍性,基于多个二元关系的粗糙集理论可以解决上述难题,因此,本文主要针对广义多粒度粗糙集进行了研究,引入元启发式算法,提出通过元启发式算法集进行了研究,引入元启发式算法,提出通过元启发式算法(蚁群算法蚁群算法)实现广义多粒度粗糙集特征选择实现广义多粒度粗糙集特征选择算法。通过实验结果看出本文所提算法可以对数据集起到降维效果且得到的特征子集的分类精度和原数算法。通过实验结果看出本文所提算法可以对数据集起到降维效果且得到的特征子集的分类精度和原数据集基本保持一致。据集基本保持一致。关键词关键词 粒计算,特征选择,广义多粒度粗糙集,二元关系粒计算,特征选择,广义
3、多粒度粗糙集,二元关系 Researches on Feature Selection Algorithm for Generalized Multi-Granularity Rough Sets Xiaomin Liang School of Computer and Control Engineering,Yantai University,Yantai Shandong Received:May 27th,2023;accepted:Jun.27th,2023;published:Jul.5th,2023 Abstract With the rapid development of in
4、formation technology,a large amount of data has been generated,which is huge in volume,diverse in form,rapid in generation,low in value density,and high in commercial value.How to make these data have a positive impact on the progress of human society 梁晓敏 DOI:10.12677/hjdm.2023.133021 214 数据挖掘 is a
5、challenge.Rough set theory can directly reduce the dimensionality of the data,discover the im-plicit knowledge in the data,and promote the social progress.The classical rough set theory is based on a single binary relationship,which lacks flexibility and universality.The rough set theory based on mu
6、ltiple binary relationships can solve the above problems.Therefore,this paper mainly focuses on the generalized multi-granularity rough set and introduces the meta-heuristic algo-rithm,and proposes to implement the generalized multi-granularity rough set feature selection algorithm by the meta-heuri
7、stic algorithm(ant colony algorithm).The experimental results show that the proposed algorithm can reduce the dimensionality of the data set and the classification accuracy of the obtained feature subsets is basically consistent with the original data set.Keywords Granular Computing,Feature Selectio
8、n,Generalized Multi-Granularity Rough Sets,Binary Relationships Copyright 2023 by author(s)and Hans Publishers Inc.This work is licensed under the Creative Commons Attribution International License(CC BY 4.0).http:/creativecommons.org/licenses/by/4.0/1.引言引言 粗糙集理论1是一个用于处理不确定的数学工具,经典粗糙集理论建立在单个二元关系上,不能
9、用于处理具有多个二元关系的决策系统。Qian 等2提出了基于多个二元关系的决策系统,称为多粒度粗糙集理论。多粒度粗糙集模型分为乐观多粒度粗糙集模型和悲观多粒度粗糙集模型,由于乐观多粒度粗糙集模型的构造过于放松,悲观多粒度粗糙集模型的构造过于严苛,因此,Xu 等3提出了广义多粒度粗糙集模型。一些学者针对广义多粒度粗糙集理论进行了深入研究。Qian 等4构造了一个广义层次决策表,并将多粒度和序贯三支决策相结合,提出了广义层次多粒度序贯三支决策模型。Xu 等5通过考虑类与概念之间的相对和绝对定量信息,提出了两种广义多粒双定量决策理论粗糙集模型。Xu 等6针对局部广义多粒度邻域粗糙集模型,提出了动态更
10、新近似的方法。张先韬等7给出了广义多粒度粗糙集约简的一些基本性质,给出 matlab 计算的过程及计算实例。在已有研究中,广义多粒度粗糙集特征选择的研究并不完善,未有人通过元启发式算法进行广义多粒度粗糙集特征选择算法的研究。元启发式算法是启发式算法的改进,由于其有较好的泛化性、较强的通用性,现已被广泛应用于各个领域。因此,本文首先介绍了广义多粒度粗糙集的相关概念,然后详细介绍了蚁群算法的基础知识,在此基础上提出通过元启发算法(蚁群算法)实现对广义多粒度粗糙集特征选择算法的研究。实验结果表明,本文所提的算法可以对高维数据进行降维,并且得到的特征子集并没有降低原数据集的分类精度。2.基本概念基本概
11、念 四元组(),DSU ATCD V f=为决策系统,其中 U 为论域,C 为条件属性集,D 为决策属性集,V 为kaAT的值域集,f 为映射函数。定义定义 1 8给定决策系统(),DSU ATCD V f=,对XU,粒度集12,mPP PP=,()1iPCim,通过特征函数()iPXSx描述 X 和等价类 iPx之间的包含关系,特征函数()iPXSx定义为:Open AccessOpen Access梁晓敏 DOI:10.12677/hjdm.2023.133021 215 数据挖掘 ()1,0,iiPPXxXSx=其他(1im),其中()iPXSx为 x 的特征函数。定义定义 2 8给定决
12、策系统(),DSU ATCD V f=,对XU,粒度集12,mPP PP=,()1iPCim,()iPXSx是 x 的支持特征函数,(0.5,1,X 在粒度集 P 上的广义多粒度粗糙集上近似集和下近似集定义为:()()()111|1imPXmiiiSxP XxUm=,()()11|imPXmiiiSxP XxUm=.定义定义 3 8给定决策系统(),DSU ATCD V f=,对XU,粒度集12,mPP PP=,()1iPCim,X 在粒度集 P 上的广义多粒度粗糙集正域、边界域以及负域定义为:()()11miimiPiPOSXP X=,()()()111miimmiiPiiBNDXP XP
13、X=,()()()111mmmiiiiiiPPPNEGXUPOSXBNDX=.定义定义 4 8给定决策系统(),DSU ATCD V f=,不可分辨关系()IND D在 U 上导出的划分为()12,1rU DD DDrU=,粒度集12,mPP PP=,()1iPCim,(0.5,1,决策类集合U/D 在粒度集 P 上的广义多粒度粗糙集上近似集和下近似集定义为:()()()()121111,mmmmiiiiriiiiP U DP DP DP D=,()()()()121111,mmmmiiiiriiiiP U DP DP DP D=.决策类集合 U/D 在粒度集 P 上的正域和边界域定义为:()
14、()11milimilPiDU DPOSU DP D=,()()()111millimmililPiiDU DDU DBNDU DP DP D=.性质性质 1 给定决策系统(),DSU ATCD V F f=,对ABC,粒度集12_,mPBB BB=,梁晓敏 DOI:10.12677/hjdm.2023.133021 216 数据挖掘 ()1iBBim,1miiBB=,粒度集12_,kPAA AA=,()1lAAlk,1kllAA=,(0.5,1,可得()()11kmliliABPOSU DPOSU D=或()()11kmliliABPOSU DPOSU D=均不恒成立。3.广义多粒度粗糙集特
15、征选择算法广义多粒度粗糙集特征选择算法 元启发式算法包括遗传算法9、蜂群算法10、蚁群算法11等。接下来将详细介绍蚁群算法。现实生活中,蚂蚁在觅食的过程中会在其经过的路径上留下信息素,后面的蚂蚁能感知到路径上的信息素,依据信息素指导自己的行为,选择具有信息素含量较多的路径可能性最大,也会留下信息素并对走过路径上的信息素加强。这样,大量蚂蚁组成的集体觅食行为就表现为对信息素正反馈的现象,进而逼近了最优路径。受现实生活中蚂蚁觅食的影响,Dorigo 等11提出了蚁群优化算法。Jensen 等12将蚁群优化算法用于粗糙集中的特征选择。Chen 等13将粗糙集中求取核属性集的方法融合到利用蚁群优化算法
16、进行特征选择的算法中。特征选择的过程中,将单个条件属性看做一个节点,节点和节点之间的路径就是特征选择的过程,首先计算决策系统的核属性集,然后定义最大迭代次数,在每次迭代过程中给定一个由蚁群组成的搜索空间,蚁群中的每只人工蚂蚁从核属性集开始构造解,随机选择一个节点,再依据概率公式进行下一个节点的选择直到满足构造解的停止条件。每轮迭代结束后,进行信息素的更新,迭代过程结束后得到最优特征子集。下面将详细说明通过蚁群算法对决策系统进行特征选择的过程。启发式信息启发式信息 定义定义 5 8给定决策系统(),DSU ATCD V f=,粒度集12,mPP PP=,()1iPCim,对(0.5,1,D 关于
17、粒度集 P 在广义多粒度粗糙集下的依赖度定义为:11|()|(,)miiPmiiPOSU DrP DU=.定义定义 6 给定决策系统(),DSU ATCD V f=,粒度集12_,nPCC CC=,()1iCCin,1niiCC=,粒度集12_,mPBB BB=,()1jBBjm,1mjjBB=,粒度集12_,kPAA AA=,()1lAAlk,1kllAA=,ABC,(0.5,1,若属性集 B 为 DS 的广义多粒度属性约简,那么B 应该满足如下条件:1)11,mnjijirB DrC D=;2)AB,11,kmljljrA DrB D=。定义定义 7 给定决策系统(),DSU ATCD V
18、 f=,粒度集12_,mPBB BB=,()1iBBim,1miiBB=,粒度集12_,dddmPDBBBB=,lBBb()1dldm,1dmll dBBb=,BbBC,(0.5,1,对bB 的内部属性重要度定义为:()11,mdminnerilil dSigb B DrB DrB D=.当(),0innerSigb B D=,说明属性 b 是不重要的,当(),0innerSigb B D,说明属性 b 是不可缺少的。梁晓敏 DOI:10.12677/hjdm.2023.133021 217 数据挖掘 因此可以将核属性集定义为:()()|,0innercore CbC Sigb C D=.性质
19、性质 2 广义多粒度粗糙集理论中,满足核属性集是约简集的交集,即:()()core CRED C=.证明:证明:给定决策系统(),DSU ATCD V f=,粒度集12_,nPCC CC=,()1iCCin,1niiCC=,(0.5,1。1)设()aRED C,()RRED C 使得aR,满足11,mnjijirR DrC D=(粒度集 12_,mPRR RR=,()1jRRjm,1mjjRR=),因为 RCaC,故 11,mojljlrR DrAC D=(粒度集12_,oPACAC ACAC=,()1lACCalo,1ollACCa=),由定义 7 可得11,onlilirAC DrC D=
20、,即()acore C,因此可得()()core CRED C。2)设()acore C,由定义 7 可得11,onlilirAC DrC D=(粒度集12_,oPACAC ACAC=,()1lACCalo,1ollACCa=)。RCa,使得11,mojljlrR DrAC D=(粒度集12_,mPRR RR=,()1jRRjm,1mjjRR=)且AR,11,kmrmcjrjrA DrR D=(粒度集12_,kPAA AA=,()1rAArk,1krrAA=),即()RRED Ca,又因为 RCaC,那么()RRED C,因为aR,可得()aRED C,因此()()RED Ccore C。定义
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 广义 粒度 粗糙 特征 选择 算法 研究
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【自信****多点】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【自信****多点】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。