IsomapVSG-LIME:一种新的模型无关解释方法.pdf
《IsomapVSG-LIME:一种新的模型无关解释方法.pdf》由会员分享,可在线阅读,更多相关《IsomapVSG-LIME:一种新的模型无关解释方法.pdf(8页珍藏版)》请在咨信网上搜索。
1、DOI:10.11992/tis.202209010网络出版地址:https:/ 计算智能重庆市重点实验室,重庆 400065)摘 要:为了解决局部可解释模型无关的解释(local interpretable model-agnostic explanations,LIME)随机扰动采样方法导致产生的解释缺乏局部忠实性和稳定性的问题,本文提出了一种新的模型无关解释方法 IsomapVSG-LIME。该方法使用基于流形学习的等距映射虚拟样本生成(isometric mapping virtual sample generation,Iso-mapVSG)方法代替 LIME 的随机扰动采样方法来生
2、成样本,并使用凝聚层次聚类方法从虚拟样本中选择具有代表性的样本用以训练解释模型;本文还提出了一种新的解释稳定性评价指标特征序列稳定性指数(fea-tures sequence stability index,FSSI),解决了以往评价指标忽略特征的序关系和解释翻转的问题。实验结果表明,本文提出的方法在稳定性和局部忠实性上均优于现有的最新模型。关键词:局部可解释模型无关的解释;机器学习;等距映射虚拟样本生成;凝聚层次聚类;稳定性;局部忠实性;随机扰动采样;特征序列稳定性指数中图分类号:TP181 文献标志码:A 文章编号:16734785(2023)04084108中文引用格式:向许,于洪,张晓
3、霞,等.IsomapVSG-LIME:一种新的模型无关解释方法 J.智能系统学报,2023,18(4):841848.英文引用格式:XIANG Xu,YU Hong,ZHANG Xiaoxia,et al.IsomapVSG-LIME:a novel local interpretable model-agnostic ex-planationsJ.CAAI transactions on intelligent systems,2023,18(4):841848.IsomapVSG-LIME:a novel local interpretable model-agnostic explana
4、tionsXIANG Xu,YU Hong,ZHANG Xiaoxia,WANG Guoyin(Chongqing Key Laboratory of Computational Intelligence,Chongqing University of Posts and Telecommunications,Chongqing400065,China)Abstract:In order to solve the problem of lacking local fidelity and stability caused by local interpretable model-agnost-
5、ic explanations(LIME)random perturbation sampling method,a new local interpretable model-agnostic explanation,IsomapVSG-LIME is proposed in this paper.In this method,isometric mapping virtual sample generation(IsomapVSG),a virtual sample generation method based on manifold learning,is used in substi
6、tution of random perturbation samplingmethod of LIME to generate samples,and aggregation hierarchical clustering method is used to select representativesamples from virtual samples for training explanation model.In addition,this paper also proposes a new explanation sta-bility evaluation index,the f
7、eatures sequence stability index(FSSI),which solves the problem that previous evaluationindexes ignore the sequential relationship of features and the flipping of explanations.Experimental results show that theproposed method outperforms the latest models in terms of stability and local fidelity.Key
8、words:local interpretable model-agnostic explanations(LIME);machine learning;IsomapVSG;hierarchical ag-glomerative clustering;stability;local fidelity;random perturbation sampling;features sequence stability index(FSSI)机器学习是实现人工智能系统的重要方法。然而,由于可解释性的缺乏,一些具有出色性能的机器学习模型在某些特定领域的部署应用受到了严重阻碍,如医疗诊断、司法量刑、金融等
9、关键决策领域。为了克服这一弱点,许多学者对如何提高机器学习模型可解释性进行了深入的研究,并提出了大量的解释方法以帮助用户理解模 型内部的工作机制1。根据不同的标准2-4,这些方法可以大致分为以下几类:1)事前可解释和事后可解释;2)全局可解释和局部可解释;3)特定于模型的解释和模型无关的解释。收稿日期:20220906.网络出版日期:20230327.基金项目:国家自然科学基金项目(62136002,61876027);重庆英才计划项目(cstc2022ycjh-bgzxm0004).通信作者:于洪.E-mail:.第 18 卷第 4 期智能系统学报Vol.18 No.42023 年 7 月C
10、AAI Transactions on Intelligent SystemsJul.2023智能系统学报编辑部版权所有其中,模型无关解释方法尤其流行。其目标是设计一个能够解释任意机器学习模型决策过程的独立算法。局部可解释模型无关的解释(localinterpretable model-agnostic explanations,LIME)5是一种著名的模型无关算法,它首先通过随机扰动在实例周围生成模拟数据点,然后用模拟数据拟合一个加权稀疏线性模型来为单个预测提供解释。无论是何种分类器,LIME 的解释总是在局部忠实于待解释实例。由于 LIME 的灵活性和易用性,其在医疗诊断6-9、推荐系统1
11、0-11、工业12-13等领域得到了广泛应用。但 LIME 方法本身在解释稳定性和局部忠实性等方面还存在不足之处。局部忠实性指的是解释模型在待解释实例邻域内的行为和黑盒模型的接近程度。稳定性指的是在相同条件下,重复实验在理想情况下应该对相同的实例产生相同的解释。研究发现14-16,两者都与 LIME 的随机扰动采样方法有直接关系。首先,该方法产生的样本比较分散,有些样本可能不符合原始数据分布,其严重影响了解释模型的局部忠实性。其次,由于该方法的随机性,重复实验产生的样本也有所不同,其最终导致 LIME 解释缺乏稳定性。确定性 LIME(deterministic LIME,DLIME)17首先
12、利用凝聚层次聚类(agglomerate hierarchicalclustering,AHC)将数据聚类,然后用 k 近邻(k-nearest neighbor,KNN)算法选择待解释实例的相关类簇来代替 LIME 的随机扰动采样方法,提高了 LIME 解释的稳定性。贝叶斯 LIME(BayesianLIME,BayLIME)18利用贝叶斯修正方法将先验知识融入到 LIME 中,提高了 LIME 解释的稳定性和内核设置的鲁棒性。基于自编码器的 LIME(autoencoder based LIME,ALIME)19用降噪自编码器将数据从原始特征空间映射到隐空间,再进行加权操作,最后根据样本权
13、重选择待解释数据的邻域,提高了 LIME 解释的局部忠实性。稳定的LIME(stabilized-LIME,S-LIME)20利用一个基于中心极限定理的假设检验框架来确定需要扰动的数据点数,以保证结果的稳定性。此外,如何选择一个合适的指标来评价 LIME解释的稳定性也是一个重要的问题。Zafar 等17用特征稳定性指数(features stability index,FSI)指标来评价 LIME解释的稳定性。Zhao 等18用 Jac-card 系数来评价解释的稳定性。Visani 等21提出了一种统计稳定性指标变量稳定性指数(vari-ables stability index,VSI)来
14、评价解释的稳定性。以上指标均存在 2 个缺陷:1)忽略了特征的序关系;2)忽略了特征翻转问题。等距映射虚拟样本生成(isometric mappingvirtual sample generation,IsomapVSG)22是一种基于特征表示的虚拟样本生成(virtual sample genera-tion,VSG)方法,其采用了一种等距映射(isomet-ric mapping,Isomap)23的流形学习方法对数据进行降维处理,然后通过插值法和极限学习机(ex-treme learning machine,ELM)24生成虚拟样本。该方法能够在局部生成可靠的、稠密的虚拟样本。受此启发,
15、本文将 IsomapVSG 引入到 LIME 框架中代替随机扰动采样方法来生成样本,并用 AHC选择具有代表性的样本用以训练解释模型。考虑到特征的序关系和特征翻转问题,本文还提出了一种名为特征序列稳定性指数(features sequencestability index,FSSI)的解释稳定性评价指标来更加准确地度量 LIME 解释的稳定性。1 LIME 模型和 IsomapVSG 模型 1.1 LIME 模型局部代理模型本身是可解释的模型,用于解释黑盒机器学习模型的单个预测,LIME 是 Ribeiro等5提出的局部代理模型的具体实现。代理模型经过训练可以近似底层黑盒模型的预测。LIME并
16、非训练全局代理模型,而是专注于训练局部代理模型以解释单个预测。LIME 的框架结构如图 1 所示。上半部分为一个训练好的黑盒分类器,其内部工作机制未知且不限于某种模型。下半部分为 LIME 产生解释的整个工作流程,解释模型不限于某种模型。对于一个给定的黑盒模型 f 和一个待解释实例 x,LIME通过以下步骤解释 x 的分类结果 f(x):1)样本生成:随机扰动 x 产生一批指定数量的模拟数据 Z;2)样本加权:根据 Z 与目标实例 x 的相似性对样本进行加权,得到样本权重(Z);3)获取标签:将步骤 1)产生的样本输入到黑盒模型中获取样本标签信息 f(Z);4)特征选择:运用某种特征选择方法选
17、择 topk 特征;5)训练解释模型:用加权的样本(Z)和标签信息 f(Z)训练一个可解释的模型 g;6)解释:通过分析解释模型的系数来解释 f(x)。LIME 产生的解释可以表示为(x)=argmingGL(f,g,x)+(g)L式中:为损失函数和;为解释模型的复杂度,例842智能系统学报第 18 卷 L如解释模型为决策树时,模型复杂度为决策树的深度。损失函数 定义为L(f,g,x)=z,zZx(z)(f(z)g(z)2fgz式中:为黑盒模型;为解释模型;为采样得到zz的新数据点;为 的可解释表示;为加权函数,其定义为x(z)=exp(D(x,z)2/2)D式中:为欧氏距离,为核宽参数。黑盒
18、分类器待解释实例 x样本生成LIME 工作流程样本加权获取标签分类器 f训练集特征选择训练解释模型解释分类结果 f(x)图 1 LIME 框架Fig.1 LIME framework 1.2 IsomapVSG 模型IsomapVSG22的目标是通过生成可行的虚拟样本来解决小样本问题,提高软传感模型的精度。整个过程可分为以下步骤:1)利用小样本构建 ELM 模型;2)通过流形学习方法和插值方法生成虚拟样本;3)选择合适的虚拟样本并将其加入训练样本集对 ELM 模型进行修改。IsomapVSG 的流程如图 2 所示。原始训练样本特征 x标签 y特征 xvir标签 yvirIsomap 数据映射插
19、值法生成样本构建 ELM 模型y=fELM计算虚拟样本的输出yvir=fELMxvir虚拟训练样本选择可靠的虚拟样本用虚拟样本和原始样本重构 ELM 模型 图 2 IsomapVSG 流程Fig.2 Flowchart of the IsomapVSG IsomapVSG 的数据生成过程分为以下步骤:1)利用 Isomap 方法将所有基样本从原始特征空间映射到二维特征空间,得到二维空间中所xi=xi1,xi2,i=1,2,n有点的坐标和 k 个近邻。2)用插值法生成虚拟样本。根据每个投影点之间的距离和平均距离确定插补点的数量和位置,二维空间中第 i 个投影点与第 j 个投影点之间的距离为dis
20、t(xi,xj)=(xi1xj1)2+(xi2xj2)2平均距离为AD=1knni=1nj=1dist(xi,xj)dist(xi,xj)如果 2 个投影点之间的距离 大于所有投影点之间的平均距离,虚拟样本点在这 2个投影点之间的直线的 t 分割处生成产生,t 定义为t=dist(xi,xj)ADxvir RV2最终,所有的二维虚拟样本点被获取,其中 V 是虚拟样本点的数量。xixixvirxvir RVm3)获取虚拟样本在原始特征空间的表示。建立从二维投影点到原始样本点的 ELM 模型,以所有样本在二维空间的坐标为输入变量,以所有样本的原始输入为输出变量。根据建立的网络模型和,虚拟样本输出可
21、以被计算。4)选择可靠的虚拟样本。考虑到生成的虚拟样本的可行性,合适的虚拟样本受制于不等式:Li xi Ui,i=1,2,mxiLi(Ui)式中:为决策变量的第 i 维向量,为i 个决策变量的下(上)界。2 IsomapVSG-LIME 模型LIME 的目标是在待解释实例的邻域内训练第 4 期向许,等:IsomapVSG-LIME:一种新的模型无关解释方法843 一个简单的可解释的模型,通过分析解释模型的系数来解释单个预测结果。为了训练解释模型,首先需要在待解释实例的邻域内生成一批模拟数据。LIME 使用随机扰动采样的方法来生成模拟数据,该方法本身存在一些缺陷。首先,通过随机扰动生成的样本比较
22、分散,并且可能存在一些样本不符合原始数据分布,这严重影响了解释模型的局部忠实性。低的局部忠实性意味着解释方法是不可靠的。其次,由于该方法具有随机性,对于同一待解释实例,在相同条件下重复多次实验所生成样本也会有所不同,这会导致 LIME产生不稳定的解释。不稳定的解释意味着解释结果是不可信的。LIME 在邻域数据生成过程中应该考虑 3 个重要的因素。首先,生成的数据点要尽可能符合原始数据分布。其次,为了获取准确的解释,有必要在待解释实例周围生成稠密的数据。最后,为了获得稳定的解释,样本生成过程的随机性要尽可能小。IsomapVSG 采用了一种称为 Isomap的流形学习方法对数据进行降维处理,然后
23、通过插值法和极限学习机生成虚拟样本。其可以在局部生成稠密的、符合原始数据分布的虚拟样本。因此,本文将 IsomapVSG 引入 LIME 框架中代替随机扰动采样方法进行样本生成,然后用凝聚层次聚类方法从生成的样本中选择具有代表性的样本,最后用选择的样本训练一个可解释的模型来提供解释。本文提出方法的框架如图 3 所示。训练集待解释实例 x分类器 fIsomapVSG模型近邻选择样本生成样本选择特征选择获取标签样本加权训练解释模型 图 3 IsomapVSG-LIME 模型Fig.3 IsomapVSG-LIME model 对于一个给定的黑盒模型 f 和一个待解释实例 x,IsomapVSG-L
24、IME 通过以下步骤产生解释:1)近邻选择:IsomapVSG 生成模型需要一定数量的基样本作为输入,同时,模型生成的样本应该尽可能稠密。因此,通过计算欧氏距离从训练集中选出离待解释实例距离最近的 m 个样本。2)样本生成:设定需要生成的样本数量,然后将步骤 1)中选择的近邻数据作为 IsomapVSG模型的输入,生成指定数量的样本。3)样本选择:这一步的目标是从虚拟样本中选择具有代表性的数据点。给定一个最小样本数量阈值,该方法能够自适应地为待解释实例选择合适的数据点,从而确定其邻域的密度25。整个样本选择过程如算法 1 所示。算法 1样本选择 procedure DataSelection(
25、x,f,Z,)nc 2 Z l L for all doGl z Z|f(z)=l Gl xGl while True docx,cx AgglomerativeClustering(Gl,nc)|cx|if thenGl cx else breakZ ZGl Z return L其中 x 为待解释实例,f 为黑盒模型,为最小样本数量阈值,为标签集合。该算法可分为3 个步骤:根据样本的标签信息将样本划分为多个集合,每一个集合中的样本的标签相同;将每一个集合的样本并上待解释实例,然后用凝聚层次聚类方法将该集合聚为 2 类:a)包含待解释实例的类簇;b)不包含待解释实例的类簇;对待解释实例所属的类
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- IsomapVSG LIME 一种 模型 无关 解释 方法
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,个别因单元格分列造成显示页码不一将协商解决,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【自信****多点】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【自信****多点】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。