医学知识获取与发现的研究.pdf
《医学知识获取与发现的研究.pdf》由会员分享,可在线阅读,更多相关《医学知识获取与发现的研究.pdf(147页珍藏版)》请在咨信网上搜索。
1、中文摘要中文摘要医学知识自动获取与发现对医学研究分析具有重要现实意义,是解决“数据 丰富,知识贫乏”问题,提高医学工作者知识水平的关键性技术。本文提出了融基于知识编辑器的知识获取系统和基于数据挖掘技术的知识 发现系统于一体的医学知识获取与发现系统构架。以糖尿病及并发症为研究实 例,构建了一套完整的解决方案。方案包含了知识编辑和知识挖掘技术的各个功 能模块;在完成医学数据的冗余性消除、规范化储存以及数据无缝融合与共享等 任务后,实现知识归纳、提取及冗余性知识消除与可视化表达等功能。利用“知 识编辑”把医学知识整理成系统模型,并把它作为数据挖掘的原始参考。“知识 挖掘”和“知识编辑”两种技术相互印
2、证,互为补充构成本论文的目标。本课题工作重点在定性数据的关系挖掘、定量数据的聚类分析以及知识的可 视化模型化表达等方面。除了构建医学知识获取与发现系统框架外,讨论了关联 模型、Rough信息决策模型等定性数据的定量化挖掘方法以及人工神经网络、模 糊聚类分析等定量数据挖掘的技术;改进了数据挖掘理论中的关联模型:针对知 识规则的冗余性问题,提出运用集合的Apriori性质,以逆向递归方式消减冗余 规则;参照多尺度分析的概念,增加了次级支持度的参数,用条件置信度阈值均 衡知识规则的质和量,减少数据挖掘过程中丢弃的知识规则。在知识表达方法中 引入图论中的生成树的形式;同时尝试用统一建模语言实现面向计算
3、机的知识表 达;探讨模型化解析化方式实现现有文本知识的精化和融合,以糖尿病数据分析 为实例,设计并实现基于知识编辑器的交互式知识获取系统。上述工作在糖尿病 并发症流行病学分析和糖尿病相关的生理参数的数据挖掘实验中进行了检验。关键字:专家系统医学知识发现系统数据挖掘可视化表达人工神经网络 模糊C均值聚类糖尿病糖耐量低减胰岛素抵抗ABSTRACTABSTRACTAutomation of medical knowledge acquirement and discovery is significant to medical research.It is essential to solve th
4、e conflict of“data rich but knowledge poor”which is important to improve the medical researchers5 knowledge.In this paper,a systematic architecture of medical knowledge acquirement and discovery is provided including medical knowledge acquirement system based on extended knowledge editor and medical
5、 knowledge discovery system based on data mining technique.A solution based on this architecture is designed to diabetes syndrome and complication study,which includes all function modules of the medical knowledge discovery architecture and the medical knowledge acquirement architecture.“Knowledge e
6、ditor is used to summarize the medical knowledge to systematic model,which is used as the prototype of data mining.The task of this study is how to promote,fuse and complement the techniques of data mining and knowledge editor”in medical research.In this subject study,we focus on the technique detai
7、ls of quantitative mining from qualitative data,cluster analysis of quantitative data,visualization and modeling expression of knowledge and interactive data mining under the user instruction.Besides establishment of the architecture of knowledge acquirement and discovery,we discuss the association
8、rule model and rough information decision model which are the typical techniques of quantitative mining from qualitative data and artificial neural network and fuzzy C-eans cluster which are typical to quantitative data mining.The classic association rule model is modified in two ways below:the Apri
9、ori attribute of data set is used to solve the rules redundancy which means that the redundant rules would be stepwise eliminated from the rule set with k-1 length while a new rule is added to the rule set with k length.Like the mutliscale analysis,an inferior support threshold index is added to bal
10、ance the quality and quantity of rules output by the system,which could reduce the rules thrown away in the long knowledge rules mining process.Scheme based on the span tree in graph theory is designed to implement knowledge induction and visualization and Unified Modeling Language is used to expres
11、s the knowledge to computer.Refinement and fusion model of text knowledge is also studied.An interactive data mining system based on knowledge editor is designed to analyze in the diabetes research.All of these data mining techniques are tested in the epidemiological ABSTRACTanalysis of diabetes syn
12、drome and complication and the statistic distribution analysis of some physiological parameters relevant to diabetes mellitus.“Keywords:expert system medical knowledge discovery system data mining visual expression artificial neural network fuzzy C-eans cluster diabetes mellitus impaired glucose tol
13、erance insulin resistance第一章绪论第一章绪论近年来,计算机和微电子技术的迅猛发展引起了一场新的技术革命,用计算 机模拟思维及学习过程直接导致了一门新的学科的诞生人工智能(Artificial mtelligence,简称AI)。目前,作为二十世纪末的带头学科人工智能的各项技术 已经渗透到各个研究领域。为了借助计算机强大的运算能力,降低劳动强度提 高劳动效率,实现高精度自动化控制,各种专家系统、计算机辅助设计系统、机 器人乃至最近发展起来的数据挖掘技术纷纷应运而生。专家系统(Expert system,简称ES)是在某领域内模拟专家的思维活动,进行推理判断实现专门问题的
14、自动化求解的计算机程序系统。医学专家系统是其 中最典型的、最富有成果的分支之一。医学专家系统是医学工程和人工智 能研究的技术结晶,它运用专家系统的设计原理与方法,模拟医学专家诊断、治 病治疗的思维过程,帮助医生解决复杂的医学问题。这种系统除了作为医生诊断、治疗以及预后评估的辅助工具外,还有助于医学资料的电子化、规范化的保存、整理和交流。所以,作为计算机以及计算数学和医学科学的交叉医学专家系 统一度成为生物医学工程的研究热点【小31.1 医学专家系统的研究现状与面临的问题1982年匹兹堡大学的Miller等研制成功著名的Internist-1内科计算机辅助诊 断系统,其知识库包含572种疾病,4
15、500多种症状;1991年哈佛医学院开发 的“DXPLAIN”系统包含2200种疾病和5000多种症状【皿;此外除了这些多疾 病大型专家系统外,针对某一种疾病的专项医学专家系统及其类似软件更是举不 胜数。1990年,Umbaugh开发了皮肤癌辅助诊断系统。引;Provan等人研制了用 于诊断慢性腹痛的决策支持系统即;1996年Birndorf等人开发了贫血诊断报告 系统;2000年Wells等人开发了计算机辅助乳腺治疗计划系统对;Siromoney 等根据MRI影像数据区分病人是脑膜瘤还是星细胞瘤口刀;Sacha通过心脏SPECT 影像对心肌灌注进行分类从而诊断是否患有冠心病网;Bojarez
16、uk CC等人用遗 传算法实现胸痛12种疾病分类网等等。我国医学专家系统的研制起步较晚,1978 年北京中医学院著名教授关幼波及北京中医医院肝病科与计算机室的科研人员 合作开发了“关幼波肝病诊断程序是我国最早基于中医理论的医学专家系统;上个世纪80年代以来随着我国经济的腾飞、计算机应用的普及,各界有识之上 都看到了医学专家系统的良好前景,国内迅速涌现了一批专科医学专家系统,如 肝病营养疗法专家系统、昏迷诊断计算机专家系统、急性肾衰诊断系统、颈腰疾 第一章绪论病专家系统、精神疾病诊断系统、甲亢诊断系统、贫血鉴别系统、肺癌诊断系统、心功能辅助诊断系统、针灸专家系统及医病诊疗用药系统2卜四】;其中随
17、着动态 心电图系统的广泛应用,基于计算机的心电工作站软件的研制开发是最具临床应 用前景的计算机辅助医学诊断系统,有关心电图的自动识别和分类系统的研究也 最为深入【I。分析有关计算机辅助医学专家系统的研究报道可以发现此类系统的研发在 上世纪80年代到90年代中期达到高潮,然而随着研究的深入,一些技术瓶颈也 开始逐渐显现份L根据国内外计算机辅助医学诊断系统的成功和失败经验可以 发现以下重要事实:1)知识成熟性的限制。计算机辅助医学专家系统的研发是一项多学科交叉型研 究。研发团队中既要有医学专家、又要有专业人工智能开发人员、还要有深入了 解各项医学仪器的测量技术的专业人士。由于医学技术、人工智能、医
18、学测量技 术都自成一体,体系庞大;而且都处于成长期中,学科发展远未成熟;因此,合 理地组建和管理医学专家系统开发团队本身就是一项庞大的系统工程。总体开发 策略和方法只能处在实践基础上进行摸索总结的阶段,这样必然导致开发进度缓 慢而且实用性也较差凶。2)权威性难以形成。尽管医学理论和医学测量技术都在发生日新月异的变化!然而,医学仍然处于“表象”的阶段,临床诊断仍然离不开个人的经验。由于发 展的差异、环境的不同以及文化心理因素的影响,很多已开发的计算机辅助医学 分析系统的权威性得不到承认,甚至得不到临床测试的机会,大大降低了系统应 用范围和价值8卜。3)知识获取形成制约早期开发的医学专家系统基本上
19、都是传统的基于知识推 理的系统生】,知识获取技术存在缺陷。开发基于规则和知识的专家系统大约 60%70%人力物力花费在知识获取这一环节,但采取的方法基本上是由通过一 系列启发式的逻辑规则来表示专家们的医学经验。由于从专家那里获取知识,存 在表达困难且带有定性和主观的特点,因此难于定量和客观表示,从而造成了知 识的脆弱,同时由于知识获取方法和推理技术的局限也导致了推理上的困难自回 顾计算机辅助医学专家系统的发展过程不难看出,在现阶段“利用计算机制定出 诊断疾病的规则,让医生去运用”的目标是不现实的均粕J。针对早期开发的专家系统的上述缺点,出现了神经网络专家系统之类智能诊 断系统,这类系统具有自学
20、习功能,可以通过大规模并行分布式处理实现知识的 自动获取,并且可以进行并行联想和自适应推理,具有较好的实时性和较好的鲁 棒性、良好的启发性灵活性,在分类诊断以及分类的智能控制和优化求解等方面 较原有的专家系统有了很大的提高,但是此类系统还存在一些固有的缺点:1)2第一章绪论适用于解决一些规模较小的问题;2)系统的性能在很大程度上受训练数据集的 限制,难以解决异类数据源的融合和共享;3)知识提取过程繁杂而低效,存在“黑箱”操作,从而导致医学工作者的不信任。4)规则推理与知识决策技术尚 处于起步阶段。这一切决定目前医学智能诊断系统不可能具有很高的智能水平和 实用价值,也就是说目前技术条件下,在医学
21、仍然处于“表象”的阶段,实现高 智能的可以在临床中直接应用的计算机辅助医学诊断系统时机还不成熟。1.2 医学知识获取和发现知识的自动获取是专家系统的重要组成部分,分析国内外医学专家系统的报 道可以发现此类系统的解决方案在上世纪末发生了质的变化:1)以前医学知识主要来源于医学专家,获取知识后系统将之分解成若干简单的 元规则,再通过各元规则之间的布尔操作形成诊断准则。早期医学专家系统大多 采用此类解决方案,尤其是国内的中医类专家系统,所以也有人将这种医学专家 自己构建知识库所用的程序称为基于知识的编辑器(Knowledge-based editor,KBE)。TEIRESIAS系统就是Davis开
22、发的旨在为前面提到的MYCIN专家系统 提供知识的基于规则的程序,目的在于鉴别知识并将之分解成为元规则】;ONCOCIN是由Musen领导开发的一个图形交互界面的知识获取系统卬】;KAVAS-2是由Talmon等人开发的一个集医学知识获取和分析为一体的知识获取 工具MJ;1995年欧洲的GAMES II项目就是为了开发一个可以让人工智能专家 和医学专家紧密合作的医学知识获取工具13%2001年Achour等人提出统一医学 语言系统(Unified Medical Language System,UMLS)的概念,并尝试研发此类 知识获取软件【4叫 此类系统模仿人类思维,将研究重点集中在专家知识
23、的描述 表达和模糊推理环节,力求让计算机“理解”、“学会”专家的“思维决策”方式。为了提高实际系统的智能水平,一方面要增量式多次咨询多个专家,另一方面为 了解决专家之间潜在的认识冲突不得不增加系统复杂性,而这种知识冲突条件下 的智能推理技术的研究本身尚处于起步状态,因此这也是近年来医学诊断系统热 潮降温的一个重要原因。2)。二十世纪中期相比,目前医学数据的质量和数量都有了巨大的提高;因此,部分“经验积累”工作可以由计算机来承担。从大量临床数据中寻找经验或知识 正是知识发现技术的目标和任务,这也是我们研究的主要内容。山于电子测量技术、网络技术、数据库技术以及多媒体技术的迅猛发展,这 些技术把大量
24、医学信息精确地记录下来,导致医学资料爆炸性增长。尤其随着医 院信息系统(Hospital Information System,简称HIS)在各大医院逐渐投入使用,收集到信息不仅包括影像、曲线、参数等各项生理指标,而且还有病人年龄、性 3第一章绪论别、身高、体重、既往病史等大量详细的背景资料,医学数据的完整性也有了很 大的提高。数据库技术的发展解决了海量数据的存储和数据检索的效率问题,然 而数据类型的多样性和数据量的庞大已经远远超出了人的理解能力,大量的数掂 档案很少被访问,结果大型数据库变成了“数据坟墓”(data tombs);引发了“数 据丰富,信息贫乏(Data rich but in
25、formation poor)的现象“习。高性能计算机的普及为研究工作者进行大量繁琐、复杂的数据分析带来了可 能。在计算机的帮助下,发现隐藏在这些海量数据背后的那些有学术价值新的医 学知识已经成为迫切需要生物医学工程研究人员解决的课题四】。为了解决这个 在信息领域普遍性的“知识发现”问题(Knowledge Discovery in Databasest简 称KDD),近几年产生了一项从海量数据中提取知识的系统性技术数据挖 掘。作为近年来发展起来一门人工智能研究的新兴分支,数据挖掘是集数据处理 技术最新成果的系统性理论,尤其适用于医学数据分析这类缺乏先验知识的多维 数据分析。数据挖掘系统采用数
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 医学知识 获取 发现 研究
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,个别因单元格分列造成显示页码不一将协商解决,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【曲****】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【曲****】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。