基于机器学习的急性胰腺炎中医辨证模型构建.pdf
《基于机器学习的急性胰腺炎中医辨证模型构建.pdf》由会员分享,可在线阅读,更多相关《基于机器学习的急性胰腺炎中医辨证模型构建.pdf(4页珍藏版)》请在咨信网上搜索。
1、论著中国中西医结合急救杂志2 0 2 3年6 月第30 卷第3期ChinJTCMWMCritCare,Ju n e2023,Vol.30,No.3321基于机器学习的急性胰腺炎中医辨证模型构建谈贝1郑飞波?张坤3崔云峰31天津中医药大学,天津30 16 17;天津医科大学,天津300070;3天津市南开医院肝胆胰外科,天津300100通信作者:崔云峰,Email:n k y y c y f 16 3.c o m【摘要】目的基于机器学习构建急性胰腺炎(AP)的中医智能辨辩证模型,并比较不同机器学习算法模型的效能。方法检索中国知网数据库,收集2 0 0 4年12 月至2 0 2 2 年3月公开发表
2、的应用中医药治疗AP的文献资料,建立AP中医辨证信息数据库。运用决策树(DT)随机森林(RF)支持向量机(SVM)人工神经网络(A NN)K-近邻(KNN)5种机器学习算法构建AP中医辨证模型。采用五折交叉验证法对不同算法模型的效能进行评估;采用RF模型分析各个症状体征对于AP辨辩证分型的重要性。结果最终纳人符合要求的中医药治疗AP的相关文献2 6 0 篇。将所有特征中出现频次低于10 次的症状体征或证型剔除,最终留取53个症状体征作为特征变量,获得4个AP常见证型,分别为腑实热结证、肝郁气滞证、瘀毒互结证、湿热蕴结证。分别构建不同机器学习算法的AP中医辨证模型,经五折交叉验证显示,基于RF算
3、法的模型效果最佳,其准确率、查准率、查全率和F1分数均在9 5%以上(分别为9 6.2%、9 7.1%、9 5.6%、9 6.1%);而DT和KNN模型的各项效能评估结果较差。基于RF模型的特征重要性分析显示,特征重要性数值排名前10 位的症状体征依次为身目发黄(0.0 7 6 8)脉洪大(0.0 59 7)苔白(0.0 56 7)腹满硬痛拒按(0.0 535)舌淡红(0.0 531)脉弦(0.0 49 3)脉涩(0.0 47 7)舌质红(0.0 459)舌有瘀斑(0.0 430)苔薄(0.0 40 3)。结论基于RF构建的AP中医辨证模型具有较高的准确率。【关键词】急性胰腺炎;机器学习;中医
4、辨证模型;随机森林基金项目:天津市医药卫生中医中西医结合科研项目(2 0 2 10 0 6);天津市中医药重点领域科研项目(2022005)D01:10.3969/j.issn.1008-9691.2023.03.014Based on machine learning construction of traditional Chinese medicine syndrome identification model ofacutepancreatitisTan Bei,Zheng Feibo,Zhang Kun,Cui YunfengTianjin University of Traditi
5、onal Chinese Medicine,Tianjin 301617,China,Tianjin Medical University,Tianjin 300070,China;Department of Hepatobiliary and Pancreatic Surgery,Tianjin Nankai Hospital,Tianjin 300100,ChinaCAbstractObjective To establish intelligent traditional Chinese medicine(TCM)syndrome identificationmodels for acu
6、te pancreatitis(AP)based on machine learning,and compare the performance of different machine learningalgorithm models.Methods The database of China National Knowledge Infrastructure(CNKI)was researched tocollect published literatures on the application of TCM for the treatment of AP from December 2
7、004 to March 2022,and a database of TCM identification information of AP was established.Five machine learning methods such asdecision tree(DT),random forest(RF),support vector machine(SVM),artificial neural network(ANN),and K-nearestneighbor(KNN)were applied to construct TCM syndrome identification
8、 models for AP.Five-fold cross-validationwas used to evaluate the effectiveness of different algorithmic models.RF was applied to analyze the importance of eachsymptom and sign for the TCM syndrome identification of AP.ResultsA total of 260 papers related to the treatmentof AP with TCM that fulfille
9、d the requirements were finally enrolled.The symptoms and signs among all features orTCM syndrome types that occurred less than 10 times were excluded,and finally 53 symptoms and signs were retainedas characteristic variables and 4 common TCM syndrome types of AP were obtained,namely,Fu-organ excess
10、 and heatretention syndrome,liver Qi stagnation syndrome,intermingled toxin and blood stasis syndrome,and dampness-heatamassment syndrome.TCM syndrome identification models for AP with different machine learning algorithms wereconstructed.Five-fold cross-validation showed that the model based on the
11、 RF algorithm worked best,with accuracy,precision,recall and F1 score all above 95%(96.2%,97.1%,95.6%,96.1%,respectively).However,the DT and KNNmodels had poorer results for each effectiveness assessment.The feature importance analysis based on the RF modelshowed that the top 10 signs and symptoms i
12、n the ranking of feature importance were yellowing of the skin and eyes(0.076 8),flooded pulse(0.059 7),white tongue coating(0.056 7),full and stiff abdomen with pain refusing to be pressed(0.053 5),pale red tongue(0.053 1),stringent pulse(0.049 3),astringent pulse(0.0477),red tongue(0.045 9),petech
13、ialon the tongue(0.0430),and thin tongue coating(0.0403).Conclusion The TCM syndrome identification model ofAP constructed based on RF had relatively high accuracy.KeywordsIAcute pancreatitis;Machine learning;Traditional Chinese medicine syndrome identificationmodel;Random ForestFund program:Project
14、 of Scientific Research on Combination of Traditional Chinese Medicine and WesternMedicine of Tianjin Medicine Health(2021006);Tianjin Science and Technology Projects in Key Areas of TraditionalChinese Medicine(2022005)D0I:10.3969/j.issn.1008-9691.2023.03.014中国中西医结合急救杂志2 0 2 3年6 月第30 卷第3期ChinJTCMWMC
15、ritCare,Ju n e2023,Vol.30,No.3322急性胰腺炎(acute pancreatitis,A P)是一种胰腺炎症性疾病,发病率和病死率均较高 。传统中医学虽未明确提出“胰腺”这一概念,但医林改错中写道,“脾中有一管,体象玲珑”,“出水道中有回血管,其余皆系水管”2 1,该描述与胰腺的解剖结构相吻合。现代医家运用中医“扶正祛邪,整体论治”的理论,综合使用内治与外治,在AP的中西医结合治疗上取得了明显疗效 3。在人工智能兴起的浪潮中,应用机器学习等算法助力传统医学的研究与传承发展成为趋势 4。人工智能可通过大数据分析对疾病诊断和用药提供帮助 5。本研究拟依据AP各种证型的
16、症状和体征构建5种机器学习模型,包括决策树(decisiontree,D T)随机森林(randomforest,RF)支持向量机(supportvectormachine,SVM)人工神经网络(artificial neuralnetwork,ANN)和 K-近邻(K-nearest neighbor,KNN),以期促进AP中医辨证的智能化精准化发展1资料与方法1.1数据来源:考虑到模型使用的广泛性,以中国知网数据库中有关中医治疗AP的文献资料作为研究对象。以“主题=急性胰腺炎”AND“主题=中医OR主题=中药OR主题=辨证OR主题=方剂”为检索式,检索2 0 0 4年12 月至2 0 2
17、2 年3月中国知网数据库中公开发表的运用中医药治疗AP的文献数据。对症状、证型名称进行规范化处理,将同义的症状及证型合并。1.1.1文献纳人标准:患者符合AP诊断标准的文献;患者临床表现、中医证型分类等资料记录清晰完整的文献;对于重复报告的文献,纳人较早发表的文献。1.1.2文献排除标准:综述类及动物实验类文献;存在明显错误的文献;患者临床表现或证型描述不明确的文献。1.2类数据处理及数据库的建立:采用Excel软件,以双人交叉判别的方法进行数据录人,建立AP中医辩证信息数据库。将文献中出现的临床表现赋值为“1”,未出现的临床表现赋值为“0”,并录人对应的证型。使用Python3.8.2软件读
18、取预处理过的数据,利用Pandas、Nu mp y 数据处理模块进行数据处理。1.3机器学习模型建立:将数据转化为模型可以读取使用的Numpy数组形式。调用Scikit-Learn算法库中DT、RF、SVM、A NN、K NN5种机器学习算法,构建分类器,根据输人的症状体征输出相应的证型。1.3.1DT:使用Scikit-Learn算法库创建DT分类器,调用网格搜索函数,搜索模型的最优参数。用于限定节点包含训练样本数的参数为“min_samples_split,经网格搜索得到的最优参数为“5”;用于限定分支后子节点训练样本数的参数是“min_samples_leaf,其最优参数为“1”;用于限
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 基于 机器 学习 急性 胰腺炎 中医 辨证 模型 构建
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【自信****多点】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【自信****多点】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。