基于集覆盖理论的覆盖信息系统属性约简方法.pdf
《基于集覆盖理论的覆盖信息系统属性约简方法.pdf》由会员分享,可在线阅读,更多相关《基于集覆盖理论的覆盖信息系统属性约简方法.pdf(8页珍藏版)》请在咨信网上搜索。
1、第 56 卷第 1 期郑 州 大 学 学 报(理 学 版)Vol.56 No.12024 年 1 月J.Zhengzhou Univ.(Nat.Sci.Ed.)Jan.2024收稿日期:2022-09-04基金项目:国家自然科学基金项目(11871259,62076221);福建省自然科学基金项目(2019J01748,2022J01912)。第一作者:徐晔(1997),男,硕士研究生,主要从事数据挖掘、粗糙集理论及应用研究,E-mail:3108427877 。通信作者:许晴媛(1977),女,教授,主要从事粗糙集、概念格、学习空间理论及应用研究,E-mail:xqyyuan871 。基于集
2、覆盖理论的覆盖信息系统属性约简方法徐晔1,2,许晴媛1,2,李进金3,4(1.闽南师范大学 计算机学院福建 漳州 363000;2.闽南师范大学 数据科学与智能应用福建省高校重点实验室福建 漳州 363000;3.闽南师范大学 数学与统计学院福建 漳州 363000;4.闽南师范大学 福建省粒计算及其应用重点实验室福建 漳州 363000)摘要:针对覆盖信息系统属性约简问题,提出基于集覆盖理论的覆盖信息系统属性约简方法。首先,构造覆盖信息系统的相关矩阵,通过相关矩阵诱导出覆盖信息系统的集覆盖模型,并探讨了覆盖信息系统与其诱导的集覆盖模型之间的联系,发现集覆盖模型的一个极小覆盖恰是原覆盖信息系统
3、的一个属性约简集,从而可以将求解覆盖信息系统的属性约简问题转化为求解对应集覆盖模型的极小集覆盖问题。其次,利用集覆盖启发式算法(set covering heuristic algorithm,SCHA)在解决集覆盖问题上具有更高的精度和更好的性能,给出了基于 SCHA 的覆盖信息系统属性约简的求解步骤及算法。最后,通过实例验证了所提方法的可行性和有效性。关键词:集覆盖;覆盖信息系统;集覆盖启发式算法;属性约简;粗糙集中图分类号:TP182文献标志码:A文章编号:1671-6841(2024)01-0060-08DOI:10.13705/j.issn.1671-6841.2022264 Att
4、ribute Reduction Method for Covering Information System Based on Set Covering TheoryXU Ye1,2,XU Qingyuan1,2,LI Jinjin3,4(1.School of Computer Science,Minnan Normal University,Zhangzhou 363000,China;2.Key Laboratory of Data Science and Intelligent Application in Fujian Provincial Universities,Minnan
5、Normal University,Zhangzhou 363000,China;3.School of Mathematics and Statistics,Minnan Normal University,Zhangzhou 363000,China;4.Fujian Key Laboratory of Granular Computing and Application,Minnan Normal University,Zhangzhou 363000,China)Abstract:Aiming at the problem of attribute reduction in cover
6、ing information systems,an attribute re-duction method for covering information systems based on set covering theory was proposed.Firstly,the correlation matrix of the covering information system was constructed,the set covering model of the cover-ing information system was induced by the correlatio
7、n matrix and the relationship between the covering in-formation system and its induced set covering model was discussed.It was found that a minimal covering of the set covering model was exactly an attribute reduction set of the original covering information sys-tem,and the problem of attribute redu
8、ction in covering information system could be transformed into the problem of minimum covering of corresponding set covering model.Secondly,the set covering heuristic algorithm(SCHA)had higher accuracy and better performance in solving the set covering problem,and the steps and algorithm for solving
9、 the attribute reduction of covering information system based on SCHA were presented.Finally,the feasibility and effectiveness of the proposed method were verified by an ex-ample.第 1 期徐晔,等:基于集覆盖理论的覆盖信息系统属性约简方法Key words:set covering;covering information system;set covering heuristic algorithm;attribu
10、te reduc-tion;rough set0引言粗糙集理论是用于处理各种不确定性信息的有效工具1-2,已成功应用在机器学习、模式识别等人工智能领域。然而,现实中的各类信息系统具有不同类型的属性,如数值属性、集值属性、缺失属性等,经典粗糙集理论在处理这些数据时具有局限性。因此,人们提出许多方法去推广经典粗糙集理论,例如多粒度近似空间的模糊粗糙集3、多粒度决策粗糙集4、覆盖粗糙集5等。其中,覆盖粗糙集是一个比较重要的推广方向。覆盖信息系统属性约简问题是覆盖粗糙集方向的重要研究课题,探索覆盖信息系统的属性约简方法是当前的研究热点6-10。其中,文献6 通过产生相同上、下近似最小覆盖的方法得到属性
11、约简,为覆盖信息系统属性约简提供了一种有效的方法;文献7 利用区分矩阵求解覆盖信息系统的属性约简;文献8在文献6的基础上利用信息熵刻画了覆盖约简的粗糙性。集覆盖问题是一个优化问题,已广泛应用于航空人员调度、运输车辆路线安排、服务位置、制造作业分配、操作人员选择等领域。解决集覆盖问题的经典算法有人工蜂群算法11、DNA 计算方法12、贪心算法13及近似算法14等。改进集覆盖问题的经典算法是当前的研究热点15-17,例如文献16针对unicost 集覆盖问题,提出一种改进的基于配置检查的算法。近年来,出现了集覆盖问题与粗糙集属性约简问题的交叉研究。其中,文献18提出利用集覆盖问题解决传统粗糙集属性
12、约简问题;文献19-20提出利用集覆盖问题解决粗糙集扩展领域的属性约简问题。反过来,利用粗糙集理论来解决集覆盖问题的方法也相继被提出21-24。本文提出一种把覆盖信息系统的属性约简问题转化为集覆盖问题的方法,并应用集覆盖理论来研究覆盖信息系统的属性约简问题。通过构造覆盖信息系统的相关矩阵诱导出覆盖信息系统的集覆盖模型,进而建立集覆盖问题与覆盖信息系统属性约简问题之间的联系,得出集覆盖模型的一个极小覆盖恰是原覆盖信息系统的一个属性约简集,从而可以借助高效的集覆盖理论来求解覆盖信息系统的属性约简问题。集覆盖启发式算法(set covering heuristic algorithm,SCHA)25
13、在解决集覆盖问题上具有较高的精度与较好的性能,本文给出了基于 SCHA 求解覆盖信息系统属性约简的算法,并通过一个实例验证了所提方法的可行性和有效性。本文工作丰富了集覆盖理论与覆盖粗糙集理论的交叉研究,为覆盖信息系统的属性约简问题带来了新的思路与方法,同时拓展了集覆盖理论的应用领域。1基本概念1.1集覆盖问题定义 1设 E=xq:1 q y 是一个非空有限对象集合,S=Sw:1 w r 是 E 的若干非空子集构成的集族。若 S=E,则称 S 为 E 的一个集覆盖,称(E,S)为一个集覆盖模型。集覆盖问题在于求解 S 的一个非空子集 S,使得 S=E,且 S的任意真子集都不是 E 的覆盖。S 也
14、称为 E 关于覆盖 S 的一个极小覆盖。1.2覆盖信息系统及其属性约简问题定义 226给定一个论域 U=xi:1 i n,设 C=Xk:Xk U,1 k t。如果 C 中的所有子集都不为空,且 C=U,则称 C 是 U 的一个覆盖。定义 326设 U=xi:1 i n,C=Xk:1 k t 是 U 的一个覆 盖。xi U,记(xi)C=Xk:Xk C,xi Xk,记 Cov(C)=(xi)C:xiU,则 Cov(C)也是 U 的一个覆盖,称 Cov(C)为 C诱导的覆盖。定义 426设 =Cj:1 j m 是论域 U 上的一 族 覆 盖。对 于 任 意 的 x U,记(x)=(x)Cj:1 j
15、 m,称 Cov()=(x):x U为 诱导的覆盖,称(U,)为一个覆盖信息系统。设 ,若对于任意的 x U,有(x)(x),则记 Cov()Cov()。定义 5给定一个论域 U=xi:1 i n,设=Cj:1 j m 是论域 U 上的一族覆盖,定义 U上的一个关系 R=(xo,xp):xo(xp),xo U,xp U。定义 6设 =Cj:1 j m 是论域 U 上的一族覆盖,(U,)是一个覆盖信息系统。对于任意的 P ,若 Cov(P)Cov(),则称 P 是(U,)的16郑 州 大 学 学 报(理 学 版)第 56 卷一个覆盖协调集。若对于 Cj P,Cov(P-Cj)Cov()均不成立,
16、则称 P 是(U,)的一个覆盖约简集。定义 7设(U,)是一个覆盖信息系统,若P=Pz:1 z e 是(U,)的所有约简集,则称Core()=P1 P2 Pn 是(U,)的核属性集。2覆盖信息系统的集覆盖模型在本节中首先定义关于覆盖信息系统(U,)的相关矩阵 M,然后通过矩阵 M 诱导出关于覆盖信息系统(U,)的集覆盖模型(U,S),并给出覆盖信息系统(U,)与其诱导的集覆盖模型(U,S)之间的一些联系。定义 8设(U,)是一个覆盖信息系统,U=xi:1 i n,=Cj:1 j m,R=(xo,xp):xo(xp),xo U,xp U。令 U=(xp,xo):(xp,xo)R,xp U,xo
17、U,记 U=ui:1 i n2-R。定义一个 f 行 m 列的矩阵 M,其中 f=n2-R,M 中的行由 U 中元素构成,M 中的列由 中元素构成,M 的第 i 行第 j 列元素 Mij取值为 Mij=1,xo(xp)Cj,0,否则,称 M 为覆盖信息系统(U,)的相关矩阵。注:因为 U=xi:1 i n 中有 n 个元素,U中的元素为(xp,xo)的形式,所以 U 中元素个数最多为 n2个。由于 U=(xp,xo):(xp,xo)R,xpU,xo U,故 U 中元素个数等于 f=n2-R。定理 1设(U,)是一个覆盖信息系统,M 为(U,)的相关矩阵,M 中不存在所有列的值全为 0的行。证明
18、设存在第 i 行所有列的值全为 0,ui=(xp,xo)U,则对于 Cj,Mij=0,有 xo(xp)Cj。根据(x)=(x)Cj:1 j m,可得xo(xp)。根据定义 5,ui=(xp,xo)R,与定义 8 中 U=(xp,xo):(xp,xo)R,xp U,xo U矛盾。因此,矩阵 M 中不存在所有列的值全为 0的行。定理 2设(U,)是一个覆盖信息系统,M 为(U,)的相关矩阵。令 ui=(xp,xo)U,若 Mij=1,则 Cj可以区分对象对 ui=(xp,xo)U。证明令 ui=(xp,xo)U,若存在 Mij=1,则存在 Cj 使得 xo(xp)Cj,故 xo(xp)。因此,Cj
19、可以区分对象对 ui=(xp,xo)U。推论 1设(U,)是一个覆盖信息系统,U=(xp,xo):(xp,xo)R,xp U,xo U=ui:1 i n2-R。对于 U 中的任意一个元素 ui=(xp,xo),都存在一个覆盖 Cj使得 xo(xp)Cj。证明由定理 1 与定理 2 容易得证。接下来,给出一个由覆盖信息系统诱导的区分集合的定义。定义 9设(U,)是一个覆盖信息系统,U=ui:1 i n2-R,令 SCj=ui:Mij=1,uiU,则 SCj为 U 中所有能被 Cj区分的 ui构成的集合,称 SCj为 Cj诱导的区分集合。定理 3设(U,)是一个覆盖信息系统,=Cj:1 j m,U
20、=(xp,xo):(xp,xo)R,xpU,xo U=ui:1 i n2-R。所有 Cj诱导的区分 集 合 的 并 集 构 成 U 的 一 个 集 覆 盖,即mj=1SCj=U。证明 1)充分性。假设存在一个 ui=(xp,xo)U,且 uimj=1SCj,则不存在一个 Cj,使得 xo(xp)ci,xo(xp),与推论 1 矛盾,故 U mj=1SCj成立。2)必 要 性。假 设 存 在 一 个 ui=(xp,xo)mj=1SCj,且 ui U,则根据推论 1,ui=(xp,xo)mj=1SCj,必存在一个 Cj 使得 xo(xp)Cj,则 xo(xp),ui=(xp,xo)R,与定义 8
21、中 U=(xp,xo):(xp,xo)R,xp U,xo U 矛 盾,因 此mj=1SCj U。由 1)和 2)得出 mj=1SCj=U。称 mj=1SCj为覆盖信息系统(U,)诱导的 U 的集覆盖。令 S=SCj:1 j m,称(U,S)为覆盖信息系统(U,)诱导的集覆盖模型。定理 4设(U,)是一个覆盖信息系统,=Cj:1 j m,U=(xp,xo):(xp,xo)R,xpU,xo U,S=SCj:1 j m,(U,S)为(U,)诱导的集覆盖模型。S S 是集覆盖模型(U,S)的一个集覆盖,当且仅当 P=Cj:SCj S 是覆盖信息系统(U,)的一个覆盖协调集。证明 1)充分性。设 S S
22、 是集覆盖模型(U,S)的一个集覆盖,则 S=U。令 P=Cj:SCj S,由定义 6 可知,要证明 P 是(U,)的一26第 1 期徐晔,等:基于集覆盖理论的覆盖信息系统属性约简方法个覆盖协调集,需要证明 Cov(P)Cov(),即需要证明对于 xq U,有 P(xq)(xq)。对于(xq,xo)U,由定义 8 可得 xo(xq)。又由于 U=S,故(xq,xo)S,从而 Cj P,使得xo(xq)Cj,故 xo P(xq),所以 P(xq)(xq),则 Cov(P)Cov()。因此,P 是(U,)的一个覆盖协调集。2)必要性。设 P 是覆盖信息系统(U,)的一个覆盖协调集,Cov(P)Co
23、v(),则 xqU,有 P(xq)(xq)。令 S=SCi:Ci P,对于(xq,xo)U,根据定义 8 可得 xo(xq),从而 xo P(xq),(xq,xo)S,故 U S。因 S=SCi:Ci P U,从而 S=U,即 S 是集覆盖模型(U,S)的一个集覆盖。推论 2设(U,)是一个覆盖信息系统,=Cj:1 j m,U=(xp,xo):(xp,xo)R,xpU,xo U,S=SCj:1 j m,(U,S)为(U,)的集覆盖模型。S S 是集覆盖模型(U,S)的一个极小集覆盖,当且仅当 P=Cj:SCj S 是覆盖信息系统(U,)的一个覆盖约简集。证明由定理 4 容易得证。3基于集覆盖模
24、型的覆盖信息系统约简算法由上述讨论可知,求解覆盖信息系统的属性约简问题可以转化为求解集覆盖模型的极小集覆盖问题。本文选择 SCHA 来求解覆盖信息系统的属性约简,其在解决 SCP 上具有更高的精度与更好的性能。下面给出 SCHA 中用于解决 SCP 的 4 个完备策略。完备策略 1:设 E=xq:1 q y,S=Sw:1 w r,若 Sw=E,则选择 Sw作为最优化覆盖中唯一一个集合 Sw。完备策略 2:设 x E,x 只属于 Sw,Sw S,则选择 Sw作为最优化覆盖中的一个集合元素。完备策略 3:若 Sw和 Sw,Sw Sw,Sw Sw,则Sw可以被排除。完备策略 4:设 xp,xq E,
25、xp xq,用 Sn(xp)来表示所有含 xp的 Sw的集合,若 Sn(xp)Sn(xq),则可以将 xq从 E 中删除。接下来,给出基于 SCHA 的覆盖信息系统属性约简问题的求解步骤。输入:一个覆盖信 息系统(U,),其 中 U=xi:1 i n,=Cj:1 j m。输出:覆 盖 信 息 系 统(U,)的 一 个 约 简RED。步骤 1:令 RED=。步骤 2:根据定义 8 构造(U,)的相关矩阵M,设矩阵 M 的行数和列数分别为、。步骤 3:对于矩阵 M 的第 j 列(j=1,2,),计算此列中所有行的元素和,若此列中所有行的元素和等于,则 RED=RED Cj,转到步骤 8。步骤 4:
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 基于 覆盖 理论 信息系统 属性 方法
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,个别因单元格分列造成显示页码不一将协商解决,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【自信****多点】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【自信****多点】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。