关联规则挖掘——以仲景方配伍规律挖掘为例(3)分析讲课讲稿.ppt
《关联规则挖掘——以仲景方配伍规律挖掘为例(3)分析讲课讲稿.ppt》由会员分享,可在线阅读,更多相关《关联规则挖掘——以仲景方配伍规律挖掘为例(3)分析讲课讲稿.ppt(44页珍藏版)》请在咨信网上搜索。
1、关联规则挖掘关联规则挖掘 以仲景方配伍规律挖掘为例以仲景方配伍规律挖掘为例杨雪梅 博士中医证研究基地yxm_目录目录n n解决的问题n n关联规则相关理论基础n nSPSS CLEMENTINE中实现的关联规则挖掘算法n n案例:仲景方配伍规律挖掘解决的问题解决的问题关联关联n n购物篮问题:购物篮问题:购物篮问题:购物篮问题:顾客购买了牛奶后,购买面包的可顾客购买了牛奶后,购买面包的可能性有能性有多大多大多大多大n n药性规律问题:药性规律问题:药性规律问题:药性规律问题:是否酸味的药常入肝经?比例是是否酸味的药常入肝经?比例是是否酸味的药常入肝经?比例是是否酸味的药常入肝经?比例是多少?如
2、果具有酸味,那么该药入肝经的比例会多少?如果具有酸味,那么该药入肝经的比例会多少?如果具有酸味,那么该药入肝经的比例会多少?如果具有酸味,那么该药入肝经的比例会比入肝经药占全部药物的比例提升多少?比入肝经药占全部药物的比例提升多少?比入肝经药占全部药物的比例提升多少?比入肝经药占全部药物的比例提升多少?n n处方问题:处方问题:处方问题:处方问题:*专家处方中开出专家处方中开出生姜生姜生姜生姜*桂枝桂枝桂枝桂枝*白芍三白芍三白芍三白芍三味药用于治疗寒证的次数有多少?比例有多少?味药用于治疗寒证的次数有多少?比例有多少?味药用于治疗寒证的次数有多少?比例有多少?味药用于治疗寒证的次数有多少?比例
3、有多少?专家处方中开出专家处方中开出生姜生姜生姜生姜*桂枝桂枝桂枝桂枝*白芍三味药用于治疗白芍三味药用于治疗白芍三味药用于治疗白芍三味药用于治疗寒证的比例与所治疗病证中寒证出现的比例之间寒证的比例与所治疗病证中寒证出现的比例之间寒证的比例与所治疗病证中寒证出现的比例之间寒证的比例与所治疗病证中寒证出现的比例之间的比值是多少?的比值是多少?的比值是多少?的比值是多少?处方集举例处方集举例n n1麻黄;桂枝;白芍n n2麻黄;桂枝;白芍;干姜 n n3麻黄;白术;干姜 n n4桂枝;白芍;白术;干姜 n n5麻黄;桂枝;白术;干姜 目录目录n n解决的问题n n关联规则相关理论基础关联规则关联规则
4、分类关联规则分类关联规则兴趣度参数兴趣度参数n nSPSS CLEMENTINE中实现的关联规则挖掘算法n n案例:仲景方配伍规律挖掘关联规则关联规则n n关联规则关联规则 (Association Rule)(Association Rule)是形如是形如R R:A AB B的规则,的规则,满足满足A A B B=&=&supsup(R R)minmin_ _supsup&confconf (R R)minmin_ _confconf。n n其中,其中,A,BA,B均为属性集合,均为属性集合,supsup(R R)为规则为规则R R的支持度,的支持度,minmin_ _supsup为最小支持
5、度阈值;为最小支持度阈值;confconf(R R)为规则为规则R R的置信的置信度,度,min_confmin_conf为最小置信度阈值。为最小置信度阈值。n n如:如:泽泻泽泻泽泻泽泻 白术白术白术白术 猪苓猪苓猪苓猪苓 =茯苓茯苓茯苓茯苓分类关联规则分类关联规则n n分类关联规则分类关联规则 (Class Association Rule)(Class Association Rule)是形是形如如R R:C CD D的规则,满足的规则,满足C C D D=&=&supsup(R R)minmin_ _supsup&confconf(R R)minmin_ _confconf。n n其中
6、,其中,C C为条件属性为条件属性(或中药或中药)集合,集合,D D为决策为决策属性属性(或方剂分类或方剂分类);supsup(R R)为规则为规则R R的支持度,的支持度,minmin_ _supsup为最小支持度阈值;为最小支持度阈值;confconf(R R)为规则为规则R R的置信度,的置信度,min_confmin_conf为最小置信度阈值。为最小置信度阈值。n n如:桂枝如:桂枝*生姜生姜*白芍白芍寒证寒证 兴趣度参数兴趣度参数 规则规则规则规则R R的的的的支持度支持度支持度支持度定义如下:定义如下:定义如下:定义如下:supsup(R R)=)=P P(A A B B););P
7、 P(A A B B)为为为为A A和和和和B B同时出现的概率;同时出现的概率;同时出现的概率;同时出现的概率;规则规则规则规则R R的的的的置信度置信度置信度置信度定义如下:定义如下:定义如下:定义如下:confconf(R R)=)=P P(B B|A A););P P(B B|A A)为在为在为在为在A A出现条件下出现出现条件下出现出现条件下出现出现条件下出现B B的条件概率。的条件概率。的条件概率。的条件概率。规则规则规则规则R R的的的的提升度提升度提升度提升度定义如下:定义如下:定义如下:定义如下:lift(R)=lift(R)=P P(B B|A A)/)/P P(B B);
8、);条件条件条件条件A A的出现对的出现对的出现对的出现对B B出现概率的提升,说明出现概率的提升,说明出现概率的提升,说明出现概率的提升,说明A A与与与与B B之间之间之间之间的相关性,大于的相关性,大于的相关性,大于的相关性,大于1 1为相关,小于为相关,小于为相关,小于为相关,小于1 1则不相关则不相关则不相关则不相关兴趣度参数兴趣度参数n n支持度(支持度(支持度(支持度(supportsupport)、置信度)、置信度)、置信度)、置信度(confidenceconfidence)、提升度(或作用度,)、提升度(或作用度,)、提升度(或作用度,)、提升度(或作用度,liftlift
9、)是描述分类关联规则兴趣度的三项重要)是描述分类关联规则兴趣度的三项重要)是描述分类关联规则兴趣度的三项重要)是描述分类关联规则兴趣度的三项重要指标,支持度反映规则的指标,支持度反映规则的指标,支持度反映规则的指标,支持度反映规则的普遍性普遍性普遍性普遍性,置信度反,置信度反,置信度反,置信度反映规则的映规则的映规则的映规则的可靠性可靠性可靠性可靠性,提升度反应规则两侧属性,提升度反应规则两侧属性,提升度反应规则两侧属性,提升度反应规则两侧属性之间的之间的之间的之间的相关性相关性相关性相关性,通常选择支持度、置信度、,通常选择支持度、置信度、,通常选择支持度、置信度、,通常选择支持度、置信度、
10、提升度均较高的规则作为发现的有趣模式。提升度均较高的规则作为发现的有趣模式。提升度均较高的规则作为发现的有趣模式。提升度均较高的规则作为发现的有趣模式。n n关联规则挖掘算法通常需要设置两个参数:关联规则挖掘算法通常需要设置两个参数:关联规则挖掘算法通常需要设置两个参数:关联规则挖掘算法通常需要设置两个参数:即即即即最小支持度阈值最小支持度阈值最小支持度阈值最小支持度阈值minmin_ _supsup为为为为5%5%;最小置最小置最小置最小置信度阈值信度阈值信度阈值信度阈值min_confmin_conf为为为为50%50%。关联规则关联规则举例举例n n例如:例如:例如:例如:泽泻泽泻泽泻泽
11、泻 白术白术白术白术 猪苓猪苓猪苓猪苓 =茯苓茯苓茯苓茯苓sup=0.1565;conf=0.9684;lift=2.24 sup=0.1565;conf=0.9684;lift=2.24 共有共有共有共有591591首脾胃湿热方中有首脾胃湿热方中有首脾胃湿热方中有首脾胃湿热方中有9292首方剂同首方剂同首方剂同首方剂同时出现泽泻、白术、猪苓、茯苓四味中药,时出现泽泻、白术、猪苓、茯苓四味中药,时出现泽泻、白术、猪苓、茯苓四味中药,时出现泽泻、白术、猪苓、茯苓四味中药,故规则的支持度为故规则的支持度为故规则的支持度为故规则的支持度为15.65%15.65%;因;因;因;因9595首同时出首同时
12、出首同时出首同时出现泽泻、白术、猪苓三味中药的脾胃湿热方现泽泻、白术、猪苓三味中药的脾胃湿热方现泽泻、白术、猪苓三味中药的脾胃湿热方现泽泻、白术、猪苓三味中药的脾胃湿热方中有中有中有中有9292首方剂同时出现茯苓这味药,故上述首方剂同时出现茯苓这味药,故上述首方剂同时出现茯苓这味药,故上述首方剂同时出现茯苓这味药,故上述规则的置信度为规则的置信度为规则的置信度为规则的置信度为96.84%96.84%。因茯苓出现的概。因茯苓出现的概。因茯苓出现的概。因茯苓出现的概率率率率43%43%,则提升度为,则提升度为,则提升度为,则提升度为2.24.2.24.分类关联规则分类关联规则举例举例n n例如:桂
13、枝例如:桂枝例如:桂枝例如:桂枝*生姜生姜生姜生姜*白芍白芍白芍白芍寒证寒证寒证寒证 (supsup=5.6%5.6%,conf=60%conf=60%,lift=1.71,lift=1.71)n n 仲景方共仲景方共仲景方共仲景方共268268首,桂枝、生姜、白芍三味中药同首,桂枝、生姜、白芍三味中药同首,桂枝、生姜、白芍三味中药同首,桂枝、生姜、白芍三味中药同时出现在治疗寒证方剂中的频数为时出现在治疗寒证方剂中的频数为时出现在治疗寒证方剂中的频数为时出现在治疗寒证方剂中的频数为1515,桂枝、生姜、,桂枝、生姜、,桂枝、生姜、,桂枝、生姜、白芍三味药同时出现在仲景方中的频数为白芍三味药同时
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 关联 规则 挖掘 仲景方 配伍 规律 分析 讲课 讲稿
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【精***】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【精***】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。