基于多核SVM的AdaBoost心力衰竭死亡率评估模型.pdf
《基于多核SVM的AdaBoost心力衰竭死亡率评估模型.pdf》由会员分享,可在线阅读,更多相关《基于多核SVM的AdaBoost心力衰竭死亡率评估模型.pdf(8页珍藏版)》请在咨信网上搜索。
1、第5 4卷 第5期2 0 2 3年9月 太原理工大学学报J OUR NA L O F T A I YUAN UN I V E R S I T Y O F T E CHNO L OG Y V o l.5 4 N o.5 S e p.2 0 2 3 引文格式:刘晓玉,李灯熬,赵菊敏.基于多核S VM的A d a B o o s t心力衰竭死亡率评估模型J.太原理工大学学报,2 0 2 3,5 4(5):8 0 4-8 1 1.L I U X i a o y u,L I D e n g a o,Z HAO J u m i n.A m o r t a l i t y p r e d i c t i n
2、 g m o d e l f o r h e a r t f a i l u r e p a t i e n t s b a s e d o n A d a B o o s t w i t h m u l t i-k e r n e l S VMJ.J o u r n a l o f T a i y u a n U n i v e r s i t y o f T e c h n o l o g y,2 0 2 3,5 4(5):8 0 4-8 1 1.收稿日期:2 0 2 2-0 5-1 9;修回日期:2 0 2 2-0 6-2 4 基金项目:国家重大科研仪器研制项目(6 2 0 2 7 8
3、1 9);国家自然科学基金资助项目(6 2 0 7 6 1 7 7,6 1 7 7 2 3 5 8);山西省关键核心技术和共性技术研发专项资助项目(2 0 2 0 X X X 0 0 7)第一作者:刘晓玉(1 9 9 6-),硕士研究生,(E-m a i l)3 2 9 2 4 7 8 8 0 4q q.c o m 通信作者:李灯熬(1 9 7 1-),博导,教授,主要从事智能感知与物联网技术、空天地一体化与导航技术、大数据分析技术与应用研究,(E-m a i l)l i d e n g a o t y u t.e d u.c n基于多核S VM的A d a B o o s t心力衰竭死亡率评
4、估模型刘晓玉,李灯熬,赵菊敏(太原理工大学 信息与计算机学院(大数据学院),山西 晋中 0 3 0 6 0 0)摘 要:【目的】心力衰竭简称心衰,是一种复杂的临床综合征,具有高发病率、高死亡率和预后效果不佳等显著特点,是各类心脏疾病发展的终末期,严重危害人类健康。因此,对心衰患者进行早期的预后评估研究至关重要,可以最大程度地帮助患者生存。【方法】提出一种基于多核支持向量机(m u l t i k e r n e l s u p p o r t v e c t o r m a c h i n e,MK-S VM)和自适应提升算法(a d a p t i v e b o o s t i n g,A
5、 d a B o o s t)的心力衰竭死亡率评估模型(MK-S VM-A d a B o o s t).该算法利用MK-S VM将特征映射到高维空间,并依据A d a B o o s t算法将基本分类器进行集成,实现死亡率的精确预测。同时,将合成少数过采样技术(s y n t h e t i c m i n o r i t y o v e r s a m p l i n g t e c h n i q u e,S MO T E)和T o m e k l i n k s欠采样技术相结合的混合抽样方法引入到预测模型中,减轻不平衡数据集对模型性能的影响。【结果】在收集于白求恩医院的小型心衰数据集上
6、进行心衰患者3 0 d内死亡率预测实验。实验结果表明,MK-S VM-A d a B o o s t模型的准确率和召回率分别达到了8 5.6 3%和8 6.3 3%,优于现有方法,R O C曲线下与坐标轴围成的面积(a r e a u n d e r c u r v e,AU C)和其微观平均值(m i c r o-m e a n AU C,M i A-AU C)分别达到了9 1.0 0%和9 2.0 0%,表明提出的模型具有良好的稳定性。【结论】提出的模型具有较高的准确率和稳定性,可以为医生的临床决策提供一定的参考。今后课题将继续对数据集进行扩充,并对分级预警进行研究,以便对患者进行更有效的
7、评估。关键词:心力衰竭;多核支持向量机;A d a B o o s t算法;死亡率预测中图分类号:T P 1 8 1;T P 3 9 9 文献标识码:AD O I:1 0.1 6 3 5 5/j.t y u t.1 0 0 7-9 4 3 2.2 0 2 3.0 5.0 0 7 文章编号:1 0 0 7-9 4 3 2(2 0 2 3)0 5-0 8 0 4-0 8A M o r t a l i t y P r e d i c t i n g M o d e l f o r H e a r t F a i l u r e P a t i e n t s B a s e d o n A d a
8、B o o s t w i t h M u l t i-k e r n e l S VML I U X i a o y u,L I D e n g a o,Z H A O J u m i n(C o l l e g e o f I n f o r m a t i o n a n d C o mp u t e r(C o l l e g e o f D a t a S c i e n c e),T a i y u a n U n i v e r s i t y o f T e c h n o l o g y,J i n z h o n g 0 3 0 6 0 0,C h i n a)A b s
9、t r a c t:【P u r p o s e s】H e a r t f a i l u r e i s a c o m p l e x c l i n i c a l s y n d r o m e w i t h s i g n i f i c a n t f e a t u r e s s u c h a s h i g h m o r b i d i t y,h i g h m o r t a l i t y,a n d p o o r p r o g n o s i s.I t i s t h e t e r m i n a l s t a g e i n t h e d e v
10、 e l-o p m e n t o f a l l t y p e s o f h e a r t d i s e a s e a n d s e r i o u s l y t h r e a t e n s h u m a n h e a l t h.T h e r e f o r e,e a r l y p r o g-n o s t i c a s s e s s m e n t s t u d i e s o f h e a r t f a i l u r e p a t i e n t s a r e c r u c i a l t o h e l p t h e s u r v
11、 i v a l o f p a t i e n t s.【M e t h o d s】A h e a r t f a i l u r e m o r t a l i t y a s s e s s m e n t m o d e l(MK-S VM-A d a B o o s t)b a s e d o n M u l t i K e r n e l S u p p o r t V e c t o r M a c h i n e(MK-S VM)a n d A d a p t i v e B o o s t i n g(A d a B o o s t)a l g o r i t h m i
12、s p r o-p o s e d.T h e a l g o r i t h m u t i l i z e s MK-S VM t o m a p f e a t u r e s i n t o a h i g h-d i m e n s i o n a l s p a c e a n d i n-t e g r a t e s b a s i c c l a s s i f i e r s o n t h e b a s i s o f t h e A d a B o o s t a l g o r i t h m t o a c h i e v e a c c u r a t e m
13、o r t a l i t y p r e-d i c t i o n.M e a n w h i l e,a h y b r i d s a m p l i n g m e t h o d c o m b i n i n g S y n t h e t i c M i n o r i t y O v e r s a m p l i n g T e c h n i q u e(S MOT E)a n d T o m e k l i n k s u n d e r-s a m p l i n g t e c h n i q u e i s i n t r o d u c e d i n t o
14、t h e p r e d i c t i o n m o d e l t o a l l e v i a t e t h e i m p a c t o f u n b a l a n c e d d a t a s e t s o n m o d e l p e r f o r m a n c e.【F i n d i n g s】E x p e r i-m e n t s w e r e p e r f o r m e d o n a s m a l l h e a r t f a i l u r e d a t a s e t c o l l e c t e d f r o m B e
15、 t h u n e H o s p i t a l f o r m o r-t a l i t y p r e d i c t i o n i n h e a r t f a i l u r e p a t i e n t s w i t h i n 3 0 d a y s.T h e e x p e r i m e n t a l r e s u l t s s h o w t h a t t h e a c c u r a c y a n d r e c a l l o f t h e MK-S VM-A d a B o o s t m o d e l r e a c h 8 5.6 3
16、%a n d 8 6.3 3%,r e s p e c t i v e l y,w h i c h a r e b e t t e r t h a n t h a s e o f t h e e x i s t i n g m e t h o d s.T h e A r e a U n d e r C u r v e(AU C)u n d e r t h e R O C c u r v e e n c l o s e d w i t h t h e a x e s a n d i t s m i c r o-m e a n(M i A-AU C)r e a c h 9 1.0 0%a n d
17、9 2.0 0%,r e s p e c t i v e l y,w h i c h i n d i c a t e s t h a t t h e p r o p o s e d m o d e l h a s g o o d s t a b i l i t y.【C o n c l u s i o n s】T h e p r o-p o s e d m o d e l h a s h i g h a c c u r a c y a n d s t a b i l i t y,a n d c a n p r o v i d e s o m e r e f e r e n c e f o r
18、t h e c l i n i c a l d e c i-s i o n-m a k i n g o f d o c t o r s.I n t h e f u t u r e,t h e d a t a s e t w i l l b e e x p a n e d a n d t h e g r a d e d w a r n i n g s w i l l b e s t u d i e d f o r m o r e e f f e c t i v e a s s e s s m e n t o f p a t i e n t s.K e y w o r d s:h e a r t
19、f a i l u r e;m u l t i-k e r n e l s u p p o r t v e c t o r m a c h i n e;A d a B o o s t a l g o r i t h m;m o r t a l i-t y p r e d i c t i o n 心力衰竭(简称心衰),指心脏由于结构损伤或功能异常导致的不能正常泵血以满足身体需要的疾病。心衰通常由慢性糖尿病、高血压疾病、心肌病及其他心脏病病变造成,是一种复杂的临床综合征1,具有高患病率、高致死率、高医疗费用、患者逐渐年轻化和预后效果不佳等诸多特点。在中国,年龄3 5岁的成人中心衰患病率达到1.3%
20、,约1 3 7 0万。在过去的1 5 a期间,心衰患病率增长了4 4%2.2 0 2 0年,我国心衰病人的院内死亡率为1.6%,3 0 d再入院率为4.7%,平均住院时长达到9 d,年人均总费用近1.7 4万元,远高于年人均可支配收入3。可见,心衰严重威胁着人类健康,其防治形势十分严峻4。其中,对心衰患者早期预后死亡率进行准确估计,可以为医生和患者提供一定的临床参考。一方面,帮助临床医生及时了解患者未来疾病发展的状况及带来的风险,并根据患者的情况对治疗的具体方案做出明智的决策,遏制病患病情加重。另一方面,对病情风险的准确预测能够避免无意义的干预措施,减轻医疗负担5。目前,针对心衰患者预后死亡率
21、的研究模型主要分为两种。一种是基于传统医学和统计学的预后评估模型。如西雅图心衰模型、慕尼黑评分模型等。但此类模型的应用存在一定的局限性,如慕尼黑评分模型没有详细考虑影响心衰预后的各项实验室指标。另一种是基于机器学习和深度学习算法的预后评估模型。如S HAME E R e t a l6基于心衰患者的电子医疗记录,建立了相关性特征选择和朴素贝叶斯相结合的再入院率预测模型,准确率达到8 3.1 9%.A R T E T X E e t a l7基于心衰病人的人口学资料、用药及生活习惯等信息,采用序列特征选择方法和支持向量机实现心衰患者3 0 d再入院或死亡风险的预测。WANG e t a l8通过将
22、邻域判别约束准则引入到多经验核学习实现心衰患者的死亡率预测,并通过特征分析发现了对于心衰患者存亡影响程度最大的三项指标,即心率、钠元素和抗心律失常药物。S AMA D e t a l9在电子病历1 0的基础上,结合超声心动图衍生的额外测量值,采用非线性随机森林实现了心衰病人的1 a和5 a生存预测,并进行特征重要性排序,证实了超声心动图指标三尖瓣反流速度对心衰患者的生存具有重要影响。相对于基于传统医学和统计学的预后评估模型,此类模型可以综合分析患者信息,具有较好的可移植性。针对上述医学模型在数据处理和识别风险率方面的局限性,且在心衰的临床预后上存在过度依赖医生决策和医患交谈的问题,本文提出一种
23、基于多核支 持 向 量 机(m u l t i-k e r n e l s u p p o r t v e c t o r m a-c h i n e,MK-S VM)的 自 适 应 提 升 算 法(a d a p t i v e b o o s t i n g,A d a B o o s t)来进行心衰患者的死亡率研究,解决了小样本、不平衡数据下心衰患者预后情况不乐观的问题。该方法主要贡献:1)将在处理小样508 第5期 刘晓玉,等:基于多核S VM的A d a B o o s t心力衰竭死亡率评估模型本、非线性和高纬度的模式识别问题上具有优势的MK-S VM作为基本分类器,利用A d a
24、B o o s t进行快速集成学习,从而提升死亡率预测的精准度。2)在预测模型上引入S MOT E和T o m e k l i n k s相结合的混合采样方法,解决数据不平衡问题的同时能够进一步减少噪音的干扰,提升模型的稳定性。本文具体的实验流程如图1所示,主要包括数据预处理和死亡率预测算法两部分。数据预处理SMOTE+Tomek?Links心衰数据集电子健康记录MK-SVM-AdaBoost算法30?d 死亡率图1 模型算法流程图F i g.1 M o d e l a l g o r i t h m f l o w1 数据的使用1.1 数据介绍山西白求恩医院历史悠久,拥有庞大的区域卫生系统,
25、记录了多样的、全面的住院患者信息。据此我们收集并建立了小型的心衰数据集,数据集由2 0 1 8年2月至2 0 2 0年1月的有住院记录的1 1 4 0例心衰患者组成。其中,3 0 d内死亡患者有4 3 9例,未死亡患者有7 0 1例,数据集的不平衡率为1.7 1 4.为充分探讨影响心衰患者短期生存的因素,我们收集了心衰患者的5种相关信息,包括一般检查指标(性别、年龄等)、相关性疾病、用药信息、住院信息和实验室检测指标1 0。1.2 数据预处理为了提高模型的性能,本文结合医学统计经验知识,对部分连续特征进行了离散化和向量化,如用药信息。最终,心衰数据的表现形式见表1.同时,为了消除指标离群值和指
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 基于 多核 SVM AdaBoost 心力衰竭 死亡率 评估 模型
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,个别因单元格分列造成显示页码不一将协商解决,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【自信****多点】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【自信****多点】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。