医学决策支持与大数据处理-PPT.ppt
《医学决策支持与大数据处理-PPT.ppt》由会员分享,可在线阅读,更多相关《医学决策支持与大数据处理-PPT.ppt(155页珍藏版)》请在咨信网上搜索。
1、第5章医学信息分析与决策支持与大数据处理1大家好本章主要内容l l医医学学信信息息与与决决策策支支持持l l数数据据挖挖掘掘与与关关联联规规则则l l层层次次分分析析方方法法与与医医药药方方案案选选择择l l马马尔尔科科夫夫模模型型与与应应用用l l数数据据仓仓库库与与决决策策支支持持系系统统l l大大数数据据概概念念l l大大数数据据处处理理方方法法l l医医疗疗大大数数据据应应用用2大家好阅阅读读书书目目l l崔雷.医学数据挖掘.高等教育出版社l l涂子佩.大数据.广西师范大学出版社l l赵刚.大数据技术与应用实践指南.电子工业出版社l l李雄飞等.数据挖掘与知识发现(第2版).高等教育出
2、版社l l周怡.医学信息决策与支持系统.人民卫生出版社3大家好术语概念l数据、信息、知识?“1.85”是个数字奥巴马身高1.85大多数黑人男性的升高超过1.854大家好数据、信息和知识的区别与联系知识数据数据价值数据规模信息5大家好纽约警察-杰克.梅普尔的传奇数据驱动管理除了上帝,任何人都要用数据说话。-爱德华.戴明6大家好图灵奖、诺经济学奖、图灵奖、诺经济学奖、美心理学会终身成就奖美心理学会终身成就奖人类理性是有限的,人类理性是有限的,人类理性是有限的,人类理性是有限的,所有决策都是基于有所有决策都是基于有所有决策都是基于有所有决策都是基于有限理性的结果,如果限理性的结果,如果限理性的结果,
3、如果限理性的结果,如果能利用存储在计算机能利用存储在计算机能利用存储在计算机能利用存储在计算机里的信息来辅助决策,里的信息来辅助决策,里的信息来辅助决策,里的信息来辅助决策,人类理性的范围将扩人类理性的范围将扩人类理性的范围将扩人类理性的范围将扩大,决策的质量就能大,决策的质量就能大,决策的质量就能大,决策的质量就能提高。提高。提高。提高。决策支持决策支持决策支持决策支持商务智能商务智能商务智能商务智能7大家好医学信息与决策支持医学信息与决策支持l医学信息决策面临一些挑战l医学决策信息的不完全性l传输与存储过程的失真和错误l医学决策信息的不确定性。如SGPT升高l医学决策信息的时效性。朱令事件
4、l医学决策信息的扩散性。SARSl医疗卫生大数据环境。8大家好医学信息与决策支持过程医学信息与决策支持过程l临床决策过程?l决策支持l是指使用各种逻辑规则和数据处理方法,通过对低层次的数据事实关联关系的分析与合并,将其转换成高层次的、数量少的、体现系统根本特征和发展方向的知识,以辅助决策者进行决策。l第一阶段:计算机辅助信息分析(ComputerAidedInformationAnalysis,CAIA)。l人的主观能动性仍是信息分析工作的主导l第二阶段:各种类型的决策支持系统l第三阶段:新型的临床决策支持系统(CDSS)。9大家好医学信息决策的分类医学信息决策的分类l按决策的约束条件进行分类
5、l不确定型:在缺乏足够信息的条件下所得到的实际值和期望值产生了某些偏差,其结果无法用概率分布规律来描述l确定型:已知某种自然状态必然会发生l风险型:需要进行风险值的判断,虽然不知道哪种自然状态在今后发生,但各种可能自然状态在今后发生的概率可以知道。其风险是由于随机的原因而造成的实际值和期望值的差异,它的结果可以用概率分布规律来描述10大家好医学信息决策的分类医学信息决策的分类(续)(续)l按决策的目标进行分类l单目标决策:病人只要求治疗费用最少l多目标决策:决策目标若包含了治疗彻底性、治愈时间、费用和痛苦程度等多个方面的问题就是多目标决策。l按其他的方法进行分类的决策种类l决策的影响程度和重要
6、程度:战略决策和战术决策l按决策的主体不同:个人决策和集体决策;l按决策的动态性:静态决策和动态决策;l按决策问题的量化程度:定性决策和定量决策等。11大家好不确定型决策分析不确定型决策分析l案例案例5.1 12大家好不确定型决策分析不确定型决策分析(续)(续)1.乐观决策准则:各方案可能出现的结果情况不明时,采取好中取好的乐观态度三个方案的最大收益值分别是800万元、600万元和300万元,根据乐观准则,方案A1被选中,即生产复方丹参滴丸。113大家好不确定型决策分析不确定型决策分析(续)(续)2悲观决策准则三个方案的最小收益值分别是-250万元、-200万元和50万元,根据悲观准则,方案A
7、3被选中,即生产藿香正气滴丸。14大家好不确定型决策分析不确定型决策分析(续)(续)3折中决策准则原理:决策者首先确定一个乐观系数,01,则不乐观系数1-;然后分别把乐观系数和不乐观系数乘上各方案的最大收益和最小收益,把两个积相加,得各个方案的期望收益;以期望收益最大的那个方案为实施方案。例如:取=0.6,得折中收益为380万元15大家好不确定型决策分析不确定型决策分析(续)(续)4后悔值决策准则:所谓后悔值就是在同一种自然状态下各种行动方案中最大的损益值(理想值)与可能采用的行动方案的损益值之差。原理:针对每个状态先找出所有方案的最大后悔值,然后从各方案最大后悔值中找出最小值,与最小后悔值相
8、对应的方案即认为最优方案。方案A1-A3的最小悔值是250万元,故选择方案A2。16大家好不确定型决策分析不确定型决策分析(续)(续)5等概率决策准则:假定各个自然状态的发生概率相等,然后求各行动方案的期望收益值,具有最大期望收益值的方案,即最优方案。等概率决策值计算:生产复方丹参滴丸(A1)的收益=(800+320-250)/3=290;生产柴胡滴丸(A2)的收益=(600+300-200)/3=233;生产藿香正气滴丸(A3)的收益=(300+150+50)/3=16717大家好本章主要内容l l医医学学信信息息与与决决策策支支持持l l数数据据挖挖掘掘与与关关联联规规则则l l大大数数据
9、据概概念念l l层层次次分分析析方方法法与与医医药药方方案案选选择择(了了解解)l l马马尔尔科科夫夫模模型型与与应应用用(了了解解)l l数数据据仓仓库库与与决决策策支支持持系系统统l l大大数数据据处处理理方方法法l l医医疗疗大大数数据据应应用用18大家好数据挖掘的发展动力数据挖掘的发展动力需要是发明之母需要是发明之母u数据爆炸但知识贫乏数据爆炸但知识贫乏u全球每秒全球每秒290290万份电子邮件、每秒亚马逊产生万份电子邮件、每秒亚马逊产生72.972.9笔订单,每分钟笔订单,每分钟2020个小时视屏上传到个小时视屏上传到YouTube,GoogleYouTube,Google每天处理每
10、天处理24PB24PB数据;淘宝有数据;淘宝有6 6亿注亿注册会员,在线商品超过册会员,在线商品超过9 9亿,每天交易超过数千亿。亿,每天交易超过数千亿。u自动数据收集工具和成熟的数据库技术使得大量自动数据收集工具和成熟的数据库技术使得大量的数据被收集,存储在数据库、数据仓库或其他的数据被收集,存储在数据库、数据仓库或其他信息库中以待分析。信息库中以待分析。u这些数据当中大量有用的知识被淹没其中。这些数据当中大量有用的知识被淹没其中。19大家好解决方法-数据仓库和数据挖掘u数据仓库(ataWarehouse)和在线分析处理(OLAP)u在大量的数据中挖掘感兴趣的知识(规则、规律、模式、约束)u
11、支持数据挖掘技术的基础支持数据挖掘技术的基础 -海量数据搜集海量数据搜集-强大的多处理器计算机强大的多处理器计算机-数据挖掘算法数据挖掘算法20大家好数据仓库数据仓库是一个数据仓库是一个数据仓库是一个数据仓库是一个面向主题的,集面向主题的,集面向主题的,集面向主题的,集成的,相对稳定成的,相对稳定成的,相对稳定成的,相对稳定的,反映历史变的,反映历史变的,反映历史变的,反映历史变化的数据集合,化的数据集合,化的数据集合,化的数据集合,用于支持管理中用于支持管理中用于支持管理中用于支持管理中的决策支持。的决策支持。的决策支持。的决策支持。21大家好数据仓库体系结构22大家好数据仓库体系结构l数据
12、源:数据源:通常包括企业内部信息和外部信息。内通常包括企业内部信息和外部信息。内部信息包括存放于部信息包括存放于RDBMSRDBMS中的各种业务处理数据和中的各种业务处理数据和各类文档数据。外部信息包括各类法律法规、市场各类文档数据。外部信息包括各类法律法规、市场信息和竞争对手的信息等等。信息和竞争对手的信息等等。l数据的存储与管理:数据的存储与管理:决定采用什么产品和技术决定采用什么产品和技术来建立数据仓库的核心,则需要从数据仓库的技术来建立数据仓库的核心,则需要从数据仓库的技术特点着手分析。针对现有各业务系统的数据,进行特点着手分析。针对现有各业务系统的数据,进行抽取、清理,并有效集成,按
13、照主题进行组织。数抽取、清理,并有效集成,按照主题进行组织。数据仓库按照数据的覆盖范围可以分为企业级数据仓据仓库按照数据的覆盖范围可以分为企业级数据仓库和部门级数据仓库(通常称为数据集市)。库和部门级数据仓库(通常称为数据集市)。23大家好数据仓库体系结构(续)lOLAP(On Line Analysis Processing)对分析需要的数据进行有效集成,按多维模型予以对分析需要的数据进行有效集成,按多维模型予以组织,以便进行多角度、多层次的分析,并发现趋组织,以便进行多角度、多层次的分析,并发现趋势。势。lROLAPROLAP(关系型在线分析处理),基本数据和聚合数(关系型在线分析处理),
14、基本数据和聚合数据均存放在据均存放在RDBMSRDBMS之中;之中;lMOLAPMOLAP(多维在线分析处理)和(多维在线分析处理)和HOLAPHOLAP(混合型线上(混合型线上分析处理),基本数据和聚合数据均存放于多维数分析处理),基本数据和聚合数据均存放于多维数据库中;据库中;lHOLAPHOLAP基本数据存放于基本数据存放于RDBMSRDBMS之中,聚合数据存放于之中,聚合数据存放于多维数据库中。多维数据库中。24大家好数据仓库体系结构(续)l前前端端工工具具各种报表工具、查询工具、数据分析工具、数据挖掘工具以及各种基于数据仓库或数据集市的应用开发工具。l数据分析工具主要针对OLAP服务
15、器l报表工具、数据挖掘工具主要针对数据仓库。25大家好数据仓库特点l l数数数数据据据据仓仓仓仓库库库库是是是是面面面面向向向向主主主主题题题题的的的的。数数数数据据据据库库库库的的的的数数数数据据据据组组组组织织织织面面面面向向向向事事事事务务务务处处处处理理理理任任任任务务务务,而而而而数数数数据据据据仓仓仓仓库库库库中中中中的的的的数数数数据据据据是是是是按按按按照照照照一一一一定定定定的的的的主主主主题题题题域域域域进进进进行行行行组组组组织织织织。主主主主题题题题是是是是指指指指用用用用户户户户使使使使用用用用数数数数据据据据仓仓仓仓库库库库进进进进行行行行决决决决策策策策时时时时所
16、所所所关关关关心心心心的的的的重重重重点点点点方方方方面面面面,一一一一个个个个主主主主题题题题通通通通常常常常与与与与多多多多个个个个操操操操作作作作型型型型信信信信息息息息系系系系统统统统相相相相关关关关。l l数数数数据据据据仓仓仓仓库库库库是是是是集集集集成成成成的的的的。数数数数据据据据仓仓仓仓库库库库的的的的数数数数据据据据有有有有来来来来自自自自于于于于分分分分散散散散的的的的操操操操作作作作型型型型数数数数据据据据,将将将将所所所所需需需需数数数数据据据据从从从从原原原原来来来来的的的的数数数数据据据据中中中中抽抽抽抽取取取取出出出出来来来来,进进进进行行行行加加加加工工工工与
17、与与与集集集集成成成成,转转转转换换换换统统统统一一一一与与与与综综综综合合合合之之之之后后后后才才才才能能能能进进进进入入入入数数数数据据据据仓仓仓仓库库库库;26大家好数据仓库特点(续)l l数数数数据据据据仓仓仓仓库库库库是是是是随随随随时时时时间间间间而而而而变变变变化化化化的的的的。不不不不断断断断跟跟跟跟踪踪踪踪事事事事务务务务处处处处理理理理系系系系统统统统中中中中,数数数数据据据据仓仓仓仓库库库库会会会会把把把把业业业业务务务务系系系系统统统统数数数数据据据据库库库库中中中中变变变变化化化化数数数数据据据据追追追追加加加加进进进进去去去去。传传传传统统统统的的的的关关关关系系系
18、系数数数数据据据据库库库库系系系系统统统统比比比比较较较较适适适适合合合合处处处处理理理理格格格格式式式式化化化化的的的的数数数数据据据据,能能能能够够够够较较较较好好好好的的的的满满满满足足足足商商商商业业业业商商商商务务务务处处处处理理理理的的的的需需需需求求求求。稳稳稳稳定定定定的的的的数数数数据据据据以以以以只只只只读读读读格格格格式式式式保保保保存存存存,且且且且不不不不随随随随时时时时间间间间改改改改变变变变。l l数数数数据据据据仓仓仓仓库库库库是是是是稳稳稳稳定定定定的的的的(非非非非易易易易失失失失性性性性的的的的)。其其其其数数数数据据据据以以以以物物物物理理理理分分分分离
19、离离离的的的的方方方方式式式式存存存存储储储储,决决决决策策策策人人人人员员员员只只只只进进进进行行行行数数数数据据据据查查查查询询询询,而而而而不不不不进进进进行行行行数数数数据据据据修修修修改改改改。数数数数据据据据仓仓仓仓库库库库只只只只需需需需要要要要两两两两类类类类操操操操作作作作:数数数数据据据据的的的的初初初初始始始始化化化化装装装装入入入入和和和和数数数数据据据据访访访访问问问问27大家好多维数据模型l数据立方体以两维或多维来描述或分类数据,维类似关系数据库的属性或字段。三维立方体呈现。l维:是人们观察事物、计算数据的特定角度。例如,死因监测,“地区”、“时间”、“性别”、“死
20、亡原因”等构成四维数据模型。l事实:多维立方体是面向主题的,主题有事实来表示。例如主题死因分析,则死亡人数就是事实。28大家好数据立方体结构29大家好30大家好下钻下钻:一个维度可以下钻细分上卷上卷:汇总31大家好数据挖掘:数据中搜索知识(模式)知识32大家好数据挖掘数据挖掘演变过程数据挖掘演变过程33大家好数据挖掘与知识发现基本概念数据挖掘(从数据中发现知识)数据挖掘(DM):从大量的数据大量的数据中正规地发现有效的、新颖的、潜在有用的,最终可被读懂的模式的过程,简单的说就是从大量数据中提取或“挖掘”知识。医学数据挖掘:是针对医学方面的数据仓库进行挖掘知识发现:知识发现(KDD)包括数据清理
21、、数据集成、数据选择、数据变换、数据挖掘、模式评估、知识表示等步骤有人把数据挖掘视为数据中的知识发现或KDD同义词,另一些人将其视为知识发现的一个基本步骤。34大家好数据挖掘:多学科的融合DataMining数据库技术统计学机器学习模式识别算法其他学科可视化35大家好数据挖掘和知识发现的基本步骤数据挖掘和知识发现的基本步骤数据库目标数据已处理数据已转换数据模式趋势知识选择处理转换数据挖掘解释评价36大家好数据挖掘和知识发现的基本步骤(续)l选择:选择:根据某种标准选择数据l处理:处理:包括清除和充实l转换:转换:删除丢失重要内容的记录,将数据分类、格式变换等l数据挖掘:数据挖掘:运用工具或算法
22、,在数据中发现模式和规律l解释评价:解释评价:将发现的模式解释为可用于决策的知识37大家好数据挖掘:数据库中的知识挖掘(数据挖掘:数据库中的知识挖掘(KDD)l数据挖掘知识发现过程的核心数据清理与集成数据集数据仓库任务相关数据选择数据挖掘模式评估模式38大家好知识发现和数据挖掘的算法l数据挖掘算法由3部分组成:模型表达、模型评价和检索方法。l关联规则。关联规则。两个或多个变量之间存在某种规律性,称为关联。如超市中顾客买可乐和玉米片的相关性。l分类或者特征提取。分类或者特征提取。如检查特定记录并描述第一类记录的特点。如信用分析。l序列模式。序列模式。注重在一定时间段内发生的购买事件。如买电视和摄
23、像机序列。l聚类分析。聚类分析。将数据库中的记录分成子类。可用统计学方法和神经网络等非监督性符号归纳方法实现数据聚类。44大家好常用的数据挖掘方法l关联规则与关联分析l聚类分析l决策树l人工神经网络l遗传算法l粗糙集理论47大家好5.2 关联规则与关联分析关联规则与关联分析l关联规则的定义l关联规则主要反映了事物之间的关联性。在大量的看似没有任何关系的数据中,发现数据中存在的关联关系,分析事物之间的关联性。l对反映同一事物属性的一条记录,若其具有特征属性A的同时,也具有属性B,则称特征属性A和B是关联的。若A和B关联:A B。A可以表示为若干属性同时成立,逻辑与的关系,即:(A 1 A 2 A
24、 3 A 4 A k)Bl购物篮分析l生物医学:某种疾病可能同时呈现集中症状,则几种症状就表现出关联性。(如眼病,眼轴远视、和散光)48大家好关联规则的原理关联规则的原理l49大家好关联规则的原理关联规则的原理(续)(续)l50大家好关联规则的原理关联规则的原理(续)(续)l51大家好关联规则的原理关联规则的原理(续)(续)l52大家好眼科诊疗数据53大家好计算关联规则支持度l54大家好关联规则的原理关联规则的原理(续)(续)l55大家好眼科诊疗数据56大家好计算关联规则置信度l57大家好关联规则的原理关联规则的原理(续)(续)定义定义5.7项集的频度、最小支持度阈值和频繁项集的频度、最小支持
25、度阈值和频繁项集。项集。某项集的出现频度是包含该项集的事务数,简称项集的频度。如果某项集的出现频度不够多时,可以认为该项集中项间的关联规则不够有用。只有当项集的频度大于预先设定的某个频度,该规则才有用。因此,在关联分析中,通常预先设定最小支持度阈值(min_sup)。如果项集A的支持度大于或等于预先设定的最小支持度阈值,则称该项集满足最小支持度阈值,称项集A为频繁项集。频繁k项集的集合通常记为Lk。58大家好关联规则的原理关联规则的原理(续)(续)l定义定义5.8最小置信度阈值。最小置信度阈值。同样,在关联分析中,也需要预先设定最小置信度阈值(min_conf)。如果某关联规则的置信度大于或等
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 医学 决策 支持 数据处理 PPT
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,个别因单元格分列造成显示页码不一将协商解决,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【快乐****生活】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【快乐****生活】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。