数据挖掘技术在中医小儿肺炎辨证规范中的应用.docx
《数据挖掘技术在中医小儿肺炎辨证规范中的应用.docx》由会员分享,可在线阅读,更多相关《数据挖掘技术在中医小儿肺炎辨证规范中的应用.docx(12页珍藏版)》请在咨信网上搜索。
1、数据挖掘技术在中医小儿肺炎辨证规范中的应用【摘要】 以小儿肺炎为例,采用数据挖掘技术建立中医小儿肺炎辨证规范,并与“十五”前期的小儿肺炎辨证规范进行对比分析,以期为数据挖掘技术在中医辨证规范化方面做出贡献。【关键词】 辨证规范 数据挖掘 小儿肺炎 传统的中医诊断疾病包括辨病和辨证两部分。辨证是中医学中最富有特色的科学精华,也是中医诊断学的主要研究内容。中医辨证标准的研究,对于发展中医理论及提高临床诊治水平,具有极其重要的意义。目前,中医学尚缺乏公认的中医辨证规范。已经出现的中医辨证的方法多采用统计方法和逻辑分析方法,但受人为经验因素的影响,难以摆脱传统的经验模式。本文以小儿肺炎为例,提出运用数
2、据挖掘技术,通过数据预处理、数据挖掘、挖掘结果处理,从而建立中医小儿肺炎辨证规范。 中医小儿肺炎辨证规范数据挖掘的相关技术 数据挖掘是在大量的数据中自动发现有用的信息的过程,是知识发现的一部分。运用数据挖掘技术进行知识发现的过程如图所示。 数据预处理 在进行数据挖掘之前必须要经过数据预处理。数据预处理的任务是将现有的数据集转换成符合挖掘算法要求的集中的数据集。预处理工作主要通过以下步骤完成:从多个数据源中进行数据的汇集;去掉噪声数据和重复数据;进行属性选择,可以采用交互的方式让用户自己进行属性筛选,去掉那些与挖掘工作无关的属性;维度约简,可以通过某些技术,例如粗糙集技术,约简掉那些对决策不重要
3、的属性;数据规范化处理,最终得到符合挖掘要求的数据集。由于数据集可能来自各种不同的途径,因此数据预处理过程是整个知识发现过程中最耗费时间的步骤。 数据挖掘 数据挖掘过程就是根据挖掘人物的不同,选择不同算法进行数据分析的过程,主要的算法包括关联规则算法、聚类算法、时间序列分析算法。 关联规则 数据库中关联规则的挖掘可形式地定义为 设,是所有项目的集合,即数据库中的所有字段;是所有事务的集合,即数据库;每个事务是一些项目的集合,包含在中,每个事务可以用唯一的标识符来表示。设为某些项目的集合,如果?哿,则称事务包含。关联规则表示为:,其中, , ,。关联模型主要描述了一组数据项目的密切度或关系。 聚
4、类算法 聚类就是把整个数据分成不同的组,并使组与组之间的差距尽可能地大,组内数据的差异尽可能地小。聚类分析时数据集合的特征是未知的。聚类根据一定的聚类规则,将具有某种相同特征的数据聚在一起,也称为无监督学习。聚类的数学描述如下所示:给定数据集合 ,其中为数据对象,根据对象间的相似度将数据集合分成组,并满足: ,其中 ; ,则该过程称为聚类,称为簇。 时间序列分析 时间序列是指系统中某一变量的观测值按时间顺序排列成一个数值序列,展示研究对象在一定时期内的变动过程,从中寻找和分析事物的变化特征、发展趋势和规律。它是系统中某一变量受其他各种因素影响的总结果。研究时间序列的实质是通过处理预测目标本身的
5、时间序列数据,获得事物随时间过程的演变特性与规律,进而预测事物的未来发展。 粗糙集 粗糙集理论由波兰科学家在年提出。它是一种刻划不完整性和不确定性的数学工具,能有效地分析不精确、不一致、不完整等各种不完备的信息,还可以对数据进行分析和推理,从中发现隐含的知识,揭示潜在的规律。粗糙集中的一个特点就是对于所需处理的问题无需先验知识,因此具有相当的客观性。目前,粗糙集理论已经被成功地应用于挖掘属性依赖度和属性约简。 挖掘结果处理 经过数据挖掘之后得到的信息是一些数据,并不能直接帮助用户进行决策,需要将挖掘结果进行集成或可视化处理,确保将有效、有用的信息呈现出来,或者从多个不同角度进行数据分析和 挖掘
6、结果的分析。 中医小儿肺炎辨证规范数据挖掘系统的实现 中医小儿肺炎数据挖掘系统是在前期“十五”攻关课题“小儿肺炎中医证治规律研究”的研究成果基础上,通过例小儿肺炎前瞻性临床研究建立计算机数据处理平台,应用数据挖掘技术,客观建立中医辨证规范、疗效评价指标和方法体系。通过临床信息采集和数据挖掘,将重新确认小儿肺炎证型的分布;各证型症状的基本构成;确认症状间的关联关系;确认症状对病证诊断和疗效评价的贡献率以及证型之间的转换规律。系统的处理流程如图所示。 数据预处理 在进行数据挖掘之前,必须经过数据预处理。在本系统中,数据预处理完成的任务包括数据导入、缺失值处理、数据规范化处理、异常数据处理、属性约简
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 数据 挖掘 技术 中医 小儿 肺炎 辨证 规范 中的 应用
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【精****】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【精****】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。