基于可解释机器学习构建老年患者术后急性肾损伤风险预测模型.pdf
《基于可解释机器学习构建老年患者术后急性肾损伤风险预测模型.pdf》由会员分享,可在线阅读,更多相关《基于可解释机器学习构建老年患者术后急性肾损伤风险预测模型.pdf(6页珍藏版)》请在咨信网上搜索。
1、围术期并研究.688.Clin J Med Offic,No.7,Jul,2023临床军医杂志2023年7 月第51卷第7 期基于可解释机器学习构建老年患者术后急性肾损伤风险预测模型陈潮金1,2饶静怡?,叶欣妍,余文洁,段博,李播,杨基荣,黑子清11.中山大学附属第三医院麻醉科,广东广州510 6 30;2.中山大学医学院,广东深圳518 10 7摘要目的基基于机器学习算法,构建行全身麻醉非心脏手术的老年患者术后急性肾损伤(AKI)的风险预测模型,为AKI早期识别和干预提供参考。方法回顾性分析自2 0 15年10 月至2 0 2 1年10 月在中山大学附属第三医院择期行全身麻醉非心脏手术、年龄
2、6 5岁的9512 例患者的临床资料,根据排除标准,最终纳人57 8 0 例患者为研究对象。使用LASSO回归分析筛选与AKI相关的重要变量进行AKI预测模型构建。计算受试者工作特征曲线下面积(AUC)用于评估预测性能。通过SHAP模型对最优预测模型进行可解释化处理。结果57 8 0 例患者中,7 8 9例被诊断为术后AKI,发生率为13.6 5%(7 8 9/57 8 0),设为AKI组;另4991例设为非AKI 组。患者预后情况中,AKI组患者的实际住院天数长于非AKI组,总住院费用及住院期间心跳骤停发生率均高于非AKI组,差异均有统计学意义(P0.05)。单因素分析后共有33个显著变量,
3、LASSO回归分析选择了12 个特征变量构建8 个机器学习模型,最终选择了梯度提升机(GBM)模型作为风险预测模型。CBM的AUC值为0.7 7,准确性为0.7 1,敏感度为0.6 7,特异度为0.7 1。利用SHAP模型对CBM模型进行可解释化处理,得出贡献度前5的特征分别为手术时长、术前白蛋白、血清肌酐、血糖及血清钠离子浓度。结论GBM模型预测非心脏手术老年患者术后AKI发生风险的效能最优,可为围术期麻醉决策提供参考。【关键词老年患者;急性肾损伤;预测模型;机器学习;全身麻醉非心脏手术中图分类号:R654.2;R692doi:10.16680/j.1671-3826.2023.07.06文
4、章编号:16 7 1-38 2 6(2 0 2 3)0 7-0 6 8 8-0 6Construct a risk prediction model for postoperative acute kidney injury in elderly patients based on interpretablemachine learningCHEN Chao-jin-2,RAO Jing-yi?,YE Xin-yan,YU Wen-je2,DUAN Bo,LI Fan,YANG Ji-rong,HEI Zi-qing(1.Department ofAnesthesiology,The Thir
5、d Affiliated Hospital,SUN YAT-SEN University,Guangzhou 510630,China;2.SUN YAT-SEN UniversitySchool of Medicine,Shenzhen 518107,China)Abstract:Objective To develop a prediction model for acute kidney injury(AKI)in elderly patients undergoing non-cardiac sur-gery under general anesthesia based on mach
6、ine learning(ML)algorithms.Methods The clinical data of 9 512 patients aged 65 years who underwent elective non-cardiac surgery under general anesthesia in the the Third Affiliated Hospital,SUN YAT-SEN Uni-versity from October 2015 to October 2021 were retrospectively analyzed.According to the exclu
7、sion criteria,5 780 patients were finallyincluded as study objects.LASSO regression analysis was used to screen important variables related to AKI for AKI prediction modelconstruction.The area under the receiver operating characteristic curve(AUC)was calculated to evaluate predictive performance.The
8、optimal prediction model was interpretable by SHAP model.Results Among the 5 780 patients,789 were diagnosed with postoperativeAKI,with an incidence of 13.65%(789/5 780).The other 4 991 cases were classified as non-AKI group.In the prognosis of pa-tients,the actual hospitalization days of patients i
9、n AKI group were longer than those in non-AKI group,and the totalhospitalization cost and the incidence of cardiac arrest during hospitalization were higher than those in non-AKI group,with statisticalsignificance(P 6 5岁的患者发生率达10.5%2 。AKI进展迅速,发展为终末期肾病患者总病死率可达40%70%3。随着年龄增加,肾结构及功能发生退行性变,储备功能下降;对围术期肾损
10、伤因素的敏感性增加,极易发生术后AKI并向慢性肾病转化,影响远期预后4。早期识别和干预术后AKI高危患者能促进老年患者的围术期安全及快速康复。然而,如何准确预测术后AKI,仍然是老年围术期器官功能保护领域的主要难点。开发操作简单、易于推广的术后AKI预测模型,对于推动围术期老年脆弱肾功能保护具有重要的临床意义和迫切的临床需求。随着大数据、人工智能等技术在医学领域的广泛应用,机器学习(machine learning,M L)技术已用于多个专科手术术后AKI的风险因素分析和预测模型构建,包括:全膝关节置换术5,肾癌患者肾切除术6 ,成人肝移植术7 ,心脏手术8 和主动脉弓置换术9 等。ML算法建
11、立在对大量数据内在联系的探索之上,通过训练集建立预测模型,并利用测试集进行验证,充分保证预测模型的有效性。然而,由于ML模型内部机制难以理解,ML的黑箱算法无法在临床上得到有效的利用10 。由 Lundberg 等1开发的 SHapley Additive exPlanations(SHAP)方法是一种基于游戏的评估贡献程度的方法,其中,个体特征在预测任务中充当参与者,SHAP值有助于在特征之间公平地分配预测性能12 。这种方法使ML的黑箱算法在总体及单个样本层面上均能够得到解释。既往研究建立的AKI预测模型缺少对老年患者术后 AKI 的独立预测13-14,且关于 SHAP方法对相关AKI预测
12、模型进行解释的报道较少见。本研究将立足于术后AKI高发的老年人群,基于可解释的ML技术开发老年患者行全身麻醉非心脏术后AKI预测模型,为围术期决策提供理论支持。现报道如下。1对象与方法1.1研究对象回顾性分析自2 0 15年10 月至2021年10 月在中山大学附属第三医院择期行全身麻醉非心脏手术、年龄6 5岁的9512 例患者的临床资料,根据排除标准,最终纳人57 8 0 例患者为研究对象。排除标准:(1)肾切除病史;(2)肾移植术后;(3)先天性单肾;(4)终末期肾病需行连续性肾替代治疗;(5)术后血清肌酐值缺失;(6)急诊手术;(7)美国麻醉医师协会(American society o
13、f anesthe-siologists,ASA)分级IV级及以上;(8)术前7 d造影剂暴露。通过我院围术期专病数据库收集患者术前、术中及术后的临床资料,包括人口统计学数据、术前指标、术中资料、预后数据等。本研究经医院伦理委员会批准。1.2终点事件终点事件为术后7 d内发生AKI。根据改善全球肾病预后组织标准15,采用血清肌酐定义:血清肌酐在术后48 h内绝对值增加26.4mol/L,或7 d内增加达1.5倍基础肌酐值。1.3数据收集共选择43个变量纳人分析。其中,术前资料包括:(1)人口统计学特征:性别、年龄、体质量、身高;(2)术前指标:抽烟、糖尿病、外周血管疾病、脑血管疾病、高血压、慢
14、性阻塞性肺疾病、近期心肌梗死(术前1个月内)、脑卒中病史、既往和/或近期心脏手术、近期造影剂暴露(术前7 d内)、纽约心脏协会心功能分级、术前最后1次血红蛋白浓度、血清白蛋白、尿酸水平、血小板计数、血钙浓度、血钾浓度、血钠浓度、血糖浓度、谷草转氨酶、谷丙转氨酶、血清肌酐、尿素氮、高密度脂蛋白、低密度脂蛋白水平,以及术前口服药物使用情况等。术中资料包括:手术时间、术中低血压、血管活性药物使用情况、利尿剂使用情况、血制品输注量、输注液体类型、液体量、抗生素使用情况等。预后资料包括实际住院时间、总住院费用和住院期间心跳骤停发生情况。其中,术中低血压定义为平均血压(mean blood pres-su
15、re,MBP)2 0%基础值,且持续时间30 min 16。对于缺失比例 10%的指标,使用链方程算法计算模式变量和连续变量17 。为了最小化特征高维带来的潜在过度影响,只选择在单变量检验中具有统计学意义(P0.05)的特征,进行最小的绝对收缩,并利用LASSO回归方法进行特征选取。最后,利用套索回归后的非零坐标特征建立预测模型。1.4林模型构建与评估研究队列按照8:2 的比例随机分为训练集和测试集。应用LASSO回归筛选训练集中有意义的变量纳人模型构建。本研究采用决策树(decisiontree,DT)、随机森林(randomfor-est,RF)、逻辑回归(logistic regress
16、ion,LR)、高斯朴素贝叶斯(gaussian naive bayes,GNB)、自适应增强(a d a p t i v e d i s c r i mi n a t o r a u g me n t a t i o n,A D A)、梯度提OTTTTT690Clin J Med Offic,No.7,Jul,2023临床军医杂志2023年7 月第51卷第7 期升机(gradient boosting machine,GBM)、轻度梯度提升机(light gradient boosting machine,LGBM)和多层神经网络模型(mulilayer perceptron neural
17、network,MLP)共8 种机器学习算法进行建模。计算受试者工作特征(receiver operating characteristic,ROC)曲线下面积(area underthe curve,AUC)、敏感度、特异度、准确性及F1分数进行模型评估,选出最优预测模型。为进一步验证模型的有效性,本研究选取了Wu等13 构建的预测模型在同一数据库中进行统计字万法木用Python、Pan d as、SLEARN/SCRICKIT-LEARN、SH A P软件包等进行数据处理和分析。连续变量表示为均数标准差(x s)或中位数(2 5%四分位数,7 5%四分位数)M(Q 1,Q 3),组间比较,
18、采用独立样本t检验或Mann-WhitneyU检验。分类变量用例(百分率)表示,组间比较采用x检验。采用ROC曲线评估模型的预测效能。同时,对最优预测模型利用SHAP进行可解释化处理。以P0.05为差异有统计学意义。2丝结果2.1基线特征比较5780例患者中,7 8 9 例被诊断为术后AKI,发生率为13.6 5%(7 8 9/57 8 0)设为AKI组;另4991例设为非AKI组。一般资料方面,与非AKI组比较,AKI组的患者年龄更大,男性患者更多,身高更高,体质量更大,ASA分级级比例更高,且血红蛋白浓度、血小板计数、血钙浓度、血钠浓度、血清白蛋白、高密度脂蛋白、低密度脂蛋白水平更低,血糖
19、浓度、谷草转氨酶、血清肌酐、尿素氮更高,两组比较,差异有统计学意义(P0.05)。见表1。麻醉手术因素方面,与非AKI组比较,AKI组患者手术时间更长,术中低血压事件发生率更高,术中胶体补液量、红细胞、白蛋白、血浆、冷沉淀和5%碳酸氢钠量输注量更多,术中多巴胺、多巴酚丁胺、去甲肾上腺素、肾上腺素、间羟胺等血管活性药物使用更多,甘露醇使用更多,抗病毒药物、抗真菌药物、氨基糖武类抗生素使用更多,两组比较,差异均有统计学意义(P0.05)。见表2。表1AKI患者与非AKI患者的一般资料比较/M(Qi,Q)项目非AKI组(n=4991)AKI 组(n=789)P值年龄(xs,岁)70.97 5.567
20、2.28 6.070.001男性/例(百分率/%)2 615(52.39)550(69.71)0.001身高(xs,cm)161.70 8.24164.21 7.890.001体质量(xs,kg)59.44 10.4460.68 11.330.008血红蛋白浓度/gL-1128.00(115.00,138.00)123.00(105.00,137.00)0.001血小板计数/个L-I21710(168 10,26710)20510(15510,25910%)0.001血钙浓度/mmolL-12.32(2.22,2.40)2.27(2.15,2.38)0.001血钠浓度/mmolL-1142.0
21、0(140.00,143.30)141.00(139.00,143.00)0.001血钾浓度/mmolL-13.94(3.68,4.18)3.96(3.68,4.22)0.107尿酸水平/molL-1336.00(273.65,400.00)341.30(272.00,409.00)0.398血糖浓度/mmolL-15.47(4.90,6.62)5.89(4.96,7.97)0.001血清白蛋白/gL139.80(36.50,42.70)37.40(33.30,41.12)0.001谷丙转氨酶/UL-118.00(13.00,26.00)18.00(12.00,28.00)0.803谷草转氨酶
22、/UL-121.00(17.00,27.00)22.00(17.00,33.00)0.001血清肌酐/molL-I68(58,79)73(63,83)0.001尿素氮/mmolL-15.26(4.31,6.36)5.59(4.50,6.90)0.001高密度脂蛋白/mmolL-11.09(0.90,1.30)1.02(0.81,1.25)0.001低密度脂蛋白/mmolL-l2.90(2.26,3.57)2.67(2.03,3.33)0.001高血压/例(百分率/%)2.750(55.10)406(51.46)0.061糖尿病/例(百分率/%)1402(28.09)224(28.39)0.89
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 基于 可解释 机器 学习 构建 老年 患者 术后 急性 损伤 风险 预测 模型
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,个别因单元格分列造成显示页码不一将协商解决,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【自信****多点】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【自信****多点】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。