基于PSO-XGBoost机器学习模型的中老年人PCNL术后结石残留预测研究.pdf
《基于PSO-XGBoost机器学习模型的中老年人PCNL术后结石残留预测研究.pdf》由会员分享,可在线阅读,更多相关《基于PSO-XGBoost机器学习模型的中老年人PCNL术后结石残留预测研究.pdf(6页珍藏版)》请在咨信网上搜索。
1、24 China Digital Medicine.2023,Vol.18,No.8基于 PSO-XGBoost 机器学习模型的中老年人PCNL 术后结石残留预测研究唐圣晟 刘泓泽 李琳 罗云汉 廖芝美 周毅【摘要】目的:基于粒子群优化算法(PSO)的 XGBoost 模型(PSO-XGBoost)预测中老年患者经皮肾镜碎石术(PCNL)后的泌尿系统结石残留情况。方法:选取 2014 年 1 月至 2018 年 12 月在某三级甲等医院接受PCNL 治疗的 596 例中老年肾结石患者为研究对象。将数据集按 7:3 的比例随机分为训练集和测试集,建立PSO-XGBoost 模型,以准确度、精准度
2、、召回率、F1 值和 ROC 曲线下面积(AUC)等指标评估模型性能。结果:PSO-XGBoost 模型预测 PCNL 术后泌尿系统结石残留的准确度、精准度、召回率、F1 值和 AUC 均优于支持向量机、近邻算法、决策树和 BP 神经网络模型。结论:PSO-XGBoost 模型可更快、更准确地预测中老年患者 PCNL 术后是否有泌尿系统结石残留,为制定术后个性化治疗、护理方案提供参考。【关键词】机器学习;XGBoost 模型;粒子群优化算法;肾结石;经皮肾镜取石术Doi:10.3969/j.issn.1673-7571.2023.08.005【中图分类号】R691.4;R319 Researc
3、h on the prediction of residual stone after PCNL surgery in middle-aged and elderly patients based on PSO-XGBoost machine learning modelTANG Shengsheng,LIU Hongze,LI Lin,LUO Yunhan,LIAO Zhimei,ZHOU Yi.Zhongshan School of Medicine,Sun Yat-sen University,Guangzhou 510080,Guangdong Province,ChinaCorres
4、ponding author:ZHOU Yi,Email:.【Abstract】Objective To predict the kidney stone residue in middle-aged and elderly patients after percutaneous nephrolithotomy(PCNL)by the XGBoost model(PSO-XGBoost)based on particle swarm optimization algorithm(PSO).Methods A total of 596 middle-aged and elderly patien
5、ts with kidney stone who received PCNL at a Grade-A Tertiary hospital from January 2014 to December 2018 were selected for this study.The dataset was randomly divided into the training set and the test set at a ratio of 7:3,the PSO-XGBoost model was established,and the performance was evaluated by a
6、ccuracy,precision,recall,F1 score,and AUC(area under the curve).Results The accuracy rate,precision rate,recall rate,F1 score and AUC of PSO-XGBoost model outperformed those of other models,including support vector machine,nearest neighbor algorithm,decision tree and BP neural network model.Conclusi
7、on The PSO-XGBoost model can predict the presence of kidney stone residue after PCNL in middle-aged and elderly patients more quickly and accurately,which can provide reference for making personalized treatment and nursing plans after PCNL.【Keywords】Machine learning;XGBoost model;Particle swarm opti
8、mization algorithm;Kidney stone;Percutaneous nephrolithotomy基金项目:国家重点研发计划(2022YFC3601600,2021YFC2009400);广州市科技计划项目(202206010028);广东省科技创新战略专项(202011020004);2023大学生创新创业训练项目(202310657)作者单位:510080 广州,中山大学中山医学院通信作者:周毅,Email:专题策划人工智能在医药领域的应用Special Planning中国数字医学2023 第 18 卷 第 8 期 25结石是泌尿系统常见病症,全球发病率呈逐年增长的
9、趋势。2020 年中国泌尿外科和男科疾病诊断治疗指南1显示,中国成年人泌尿系统结石的患病率为1%5%,每 10 万 人 中 每 年 新增患者 150 200 例,与美国、泰国为世界范围内 3 个结石高发 区2-3。结石病在中老年人群发病率较高,虽然中老年人是由功能或损伤来定义的,而不仅仅是年龄,但通常 45 岁的个体被认为是中年人,65 岁的个体被认为是老年人。与年轻患者相比,中老年人非生理性疾病(如麻醉下手术干预)的发病率和死亡率更高4。经皮肾镜碎石术(percutaneous nephrolithotomy,PCNL)是 目 前治疗肾结石的主要手术方式,具有效果好、创伤小、恢复快等优点5。
10、虽然 PCNL 治疗肾结石的残留率相对较低,但并非所有患者都能达到理想的治疗效果。调查6显示,只有 7.9%的患者可以通过尿液逐渐排出结石,92.1%的患者术后结石仍会缓慢增长,需要二次手术。近年来,随着机器学习和人工智能技术的发展,基于大数据和深度学习的疾病预测方法已广泛应用于临床医学领域,尤其是预测模型的构建7-9。Hung 等7提出一种处理自动性能指标的新型机器学习方法,以评估手术性能并预测机器人辅助根治性前列腺切除术的临床结果。Bartsch等8利用机器学习算法,筛选出与预后相关的主要基因,预测膀胱癌经尿道膀胱肿瘤切除术后的 5 年复发率。机器学习算法预测碎石残留方面也有较多研究10-
11、13。Aminsharifi等10首先使用机器学习方法预测PCNL 的效果,研究发现与当前的评分系统相比,机器学习方法的预测结果更胜一筹,AUC 达 0.915。Shabaniyan 等11基于多重分类器开发了预测肾结石术后结果决策支持系统,预测准确率达 94.8%。相比传统的统计方法,机器学习具有灵活性和可伸缩性的优势,且能很好地处理多变量交互及共线性问题。因此,利用机器学习算法开发一种准确、可靠的 PCNL 术后结石残留预测方法,对于指导临床治疗和提高患者生活质量具有重要意义。1 资料与方法1.1 一般情况选择2014年1月至2018年12月 在某三级甲等医院泌尿外科接受PCNL 治疗的肾
12、结石患者 596 例,其中男 328 例,女 268 例;年龄4583 岁,平均(57.348.13)岁。回顾性分析所有患者治疗期间的一般临床资料,以患者的性别、年龄、既往同侧手术史、结石和肾脏特征等 25 项指标为变量,分析 PCNL术后结石残留的影响因素。1.2 方法1.2.1 XGBoost 模型 XGBoost(eXtreme GradientBoosting)是一种极限梯度 提升算法,其目标函数由训练损失函数和正则化项组成。XGBoost 模型不是一次性训练出所有的决策树,而是通过逐步添加新的决策树优化目标函数,以残差的形式不断进行迭代,最终构建预测模型。给定数据集,和分别为 PCN
13、L 术结石残留相关特征和结局变量,则模型可表示为式(1):(1)式中,为预测值;为回归树数量;为第棵回归树预测样本的值。XGBoost 模型在传统损失函数的基础上通过引入模型复杂度来衡量算法的运算效率,其目标函数为式(2):(2)其中,为训练误差,为训练样本的数量;为正则化项,表示树的复杂度,用于控制模型计算效率,避免过拟合,其定义为式(3):(3)式中,为叶子结点的惩罚系数;为正则项系数;和分别为第 棵树的叶子数目和权重;为第 个叶子的权重系数。XGBoost 采用贪心算法搜寻最优的树结构,每次选取增益最大的分割点进行分裂,增益为式(4):(4)式中,G 为信息增益,等式右侧 4 项依次表示
14、分割方案的左子树分值、右子树分值、不分裂情况下的分值和复杂度正则化惩罚系数。当树达到了深度限制或所有节点分裂方案出现G0时,树停止分裂。专题策划人工智能在医药领域的应用Special Planning26 China Digital Medicine.2023,Vol.18,No.81.2.2 粒子群优化算法(particle swarm optimization,PSO)PSO是一种基于群鸟觅食行为的最优化决策方法。该方法通过模拟鸟群寻找最佳觅食区域的过程实现最优化决策。整个鸟群的觅食活动总体上向全局最优解所在的觅食区域移动,通过不断迭代、速度更新以及鸟群觅食位置的不断变化,鸟群逐渐靠近最优
15、位置14。根据待优化的参数取值范围,构建 N 维空间,并设置 M 个粒子以实现最优位置的搜索。每个粒子的位置被随机生成,其速度初始化为 0。在每一次的搜索过程中,计算每个粒子的适应度值,判断当前位置是否为全局最优或个体最优位置。记录每个粒子的最优位置,所有粒子最优位置中的最优解即可作为整个粒子群的最佳位置。每次搜索后,根据式(5)更新粒子的速度和位置:(5)其中分别为局部和全局最优位置。是调整局部最优值和全局最优值权重的参数。是 0,1 的随机数,是约束因子。是一个非负数,称为惯性因子,当的取值较大的时候,PSO 的全局搜索能力较好;而取值较小的时候,局部能力较好。1.3 建模1.3.1 Bo
16、ruta 特征选择算法 变量选择是提高模型预测能力和降低计算复杂度的关键步骤。Boruta 算法是一种基于树模型的变量选择方法,可以克服树模型在计算变量重要性时存在的随机性和显著性检验的缺陷。该算法综合考虑多个变量之间的相互作用,筛选出与模型性能显著相关的变量15。其核心思想是通过对比真实特征变量和随机生成的变量(称为阴影变量)的重要性,判断哪些特征是有意义的。具体操作流程如下。(1)构造阴影变量。随机打乱患者25项真实特征构成的矩阵R,得到阴影特征矩阵 S,并将其与特征矩阵 R 拼接,形成新的特征矩阵 M=R,S。(2)以新的特征矩阵 M 作为输入,利用 XGBoost 模型进行训练和评估,
17、输出各特征的重要性。(3)以阴影变量的重要性最大值为阈值,将真实特征中低于该值的特征视为不重要的特征。(4)剔除不重要的特征,并重复上述步骤,直到所有真实特征都被判定为重要或不重要,从而得到最优特征子集。1.3.2 建模过程 经过特征筛选后,从总体样本中随机抽取 70%的样本(n=417 例)作为训练集,剩余30%的样本(n=179 例)作为测试集。为避免参数调优过程中出现的投机性和计算量大等问题,本研究将 PSO 算法和 XGBoost 模型结合起来,在训练集上进行训练。对XGBoost 模型的主要超参数,包括决策树个数、学习率、最小叶子节点样本权重和、树的最大深度、节点分裂所需的最小损失函
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 基于 PSO XGBoost 机器 学习 模型 中老年人 PCNL 术后 结石 残留 预测 研究
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,个别因单元格分列造成显示页码不一将协商解决,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【自信****多点】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【自信****多点】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。