基于不同机器学习算法的影像组学模型预测浸润性乳腺癌Ki⁃67表达的价值.pdf
《基于不同机器学习算法的影像组学模型预测浸润性乳腺癌Ki⁃67表达的价值.pdf》由会员分享,可在线阅读,更多相关《基于不同机器学习算法的影像组学模型预测浸润性乳腺癌Ki⁃67表达的价值.pdf(6页珍藏版)》请在咨信网上搜索。
1、CHESTIMAGING39胸部影像学基于不同机器学习算法的影像组学模型预测浸润性乳腺癌Ki-67表达的价值张丽黄小华沈梦伊张丁懿何欣【摘要】目的:基于动态增强磁共振成像(DCE-MRI)探究不同机器学习算法的影像组学模型预测浸润性乳腺癌Ki-67表达状态的价值。方法:回顾性分析于本院行双乳磁共振检查患者,按照纳人排除标准最终纳人患者156 例,按照7:3比例分为训练集和测试集。通过单因素分析、最小绝对收缩和选择算子法和递归特征消除进行特征筛选,筛选出不同数量特征分别通过5种机器学习算法建立影像组学模型来预测浸润性乳腺癌Ki-67表达状态。比较不同模型的受试者工作特征曲线下面积(AUC)并计算
2、准确率和F1度量值评估其性能,校准曲线评估模型拟合度,并应用DeLong检验比较不同模型间的差异性。结果:同一分类器在不同的特征数下预测性能不同。在基于DCE-MRI提取的3个特征下,5种模型的预测性能相对较好,其中支持向量机的整体性能最优,AUC、准确率和F1度量值在训练集分别为0.95、0.95、0.90,在测试集分别为0.8 8、0.79、0.7 4。D e L o n g 检验显示,在基于3个特征的5个模型中,支持向量机与逻辑回归的性能差异有统计学意义(P0.001),与其余3个模型无统计学差异。结论:基于DCE-MRI所构建的影像组学模型可以预测浸润性乳腺癌Ki-67表达状态,该方法
3、有望为临床医生对浸润性乳腺癌的术前干预和预后提供指导。【关键词】乳腺癌;Ki-67;影像组学;磁共振成像;机器学习中图分类号:R445.2文献标志码:A文章编号:10 0 6-57 41(2 0 2 4)0 1-0 0 39-0 6The Value of Radiomics Models Based on Different Machine Learning inPredicting Ki-67 Expression in Invasive Breast CancerZHANG Li,HUANG Xiaohua,SHEN Mengyi,ZHANG Dingyi,HE XinAbstract】
4、Pu r p o s e:T o e x p l o r e t h e v a l u e o f r a d i o m i c s m o d e l s w i t h d i f f e r e n t m a c h i n e l e a r n i n g a l g o r i t h m s i npredicting Ki-67 expression in invasive breast cancer based on dynamic contrast-enhanced magnetic resonanceimaging(DCE-MRI).Methods:We retro
5、spectively analysed the patients who underwent breast MRI examinations atour hospital.Following the inclusion and exclusion criteria,we included 156 patients and divided them into trainingand test sets at a ratio of 7:3.The study employed single factor analysis,least absolute shrinkage and selection
6、operator(LASSO),and recursive feature elimination(RFE)to select features.Different numbers of features werescreened out,and then five machine learning algorithms were used to establish radiomics models to predict theexpression of Ki-67 in invasive breast cancer.The study compared different models by
7、 the area under the curve(AUC)of the receiver operating characteristic(ROC)curve and evaluating their performance based on accuracy andF1 values.The calibration curve was used to assess the models goodness of fit,and the DeLong test was used tocompare the predictive efficiency of the models.Results:
8、The prediction performance of the same classifier wasdifferent under different number of features.Under the three features extracted based on DCE-MRI,the predictionperformance of the five models was relatively good,among which the support vector machine(SVM)had the bestperformance.Its AUC,accuracy a
9、nd F1 values were 0.95,0.95,0.90 in the training set and 0.88,0.79,0.74 in the testset,respectively.The DeLong test revealed that among the five models based on three features,there was a中国医学计算机成像杂志,2 0 2 4,30:39-44作者单位:川北医学院附属医院放射科通信地址:四川省南充市顺庆区江路2 34号,南充6 37 0 0 0通信作者:黄小华(电子邮箱:150 8 2 7 97 553 16
10、)Chin Comput Med Imag,2024,30:39-44Department of Radiology,Affiliated Hospital of North Sichuan MedicalUniversityAddress:234Fujang Road,Nanchong 637000,ChinaCorrespondence to:HUANG Xiaohua(E-mail:)40中国医学计算机成像杂志2 0 2 4年第30 卷第1期Chin Computt Med lmag,2024,30(1)significant difference in performance betw
11、een SVM and logistic regression(P0.001).However,no significantdifference was observed between SVM and the other three models.Conclusion:The radiomics model based on DCE-MRI can predict the Ki-67 expression of invasive breast cancer.This method is expected to provide guidance forclinicians on preoper
12、ative intervention and prognosis of invasive breast cancer.Key words Breast cancer;Ki-67;Radiomics;Magnetic resonance imaging;Machine learning乳腺癌已取代肺癌成为全球最主要的女性癌症,也是全球女性癌症死亡的首要原因,其早期诊断可显著延长患者的生存期。随个体化治疗的推进,Ki-67等生物标志物在临床中应用越来越广泛,乳腺癌中Ki-67高表达提示更高的复发率与更差的预后2 。因此,早期预测乳腺癌Ki-67的表达能更好辅助临床医生制定个体化治疗方案。目前临床上
13、Ki-67的检测主要通过穿刺或术后组织病理活检,由于乳腺癌的异质性【3,活检取得的部分组织不能代表整个肿瘤的Ki-67表达状态,且均为有创检查,因此需寻求无创、能有效评估整个肿瘤Ki-67表达状态的方法。影像组学可高通量提取定量特征,具有较强的可重复性。动态增强磁共振成像(dynamic contrast-enhanced magnetic resonance imaging,DCE-MRI)能反映肿瘤的形态和功能,被广泛用于预测乳腺癌的分型,预后等【4-5。目前国内研究大多基于单一特征提取或单一算法预测乳腺癌Ki-67表达状态6-7 ,但不同机器学习模型或不同特征下同一模型对疾病诊断的效能可
14、能有所不同。因此本研究基于DCE-MRI所提取的影像组学特征,探讨利用不同数量影像组学特征和不同机器学习算法对浸润性乳腺癌Ki-67表达状态的预测能力。方法1.一般资料经川北医学院附属医院伦理委员会的批准(批准文号:2 0 2 3ER131-1),该回顾性研究免除患者的知情同意书。回顾性收集2 0 2 1年4月一2 0 2 2 年12 月于本院行双乳磁共振检查的患者,按照纳入排除标准最终纳人患者156 例,平均年龄(51.8 9.7)岁。纳人标准:(1)经穿刺或手术组织病理活检证实为浸润性乳腺癌;(2)既往未进行乳腺相关治疗;(3)有完整免疫组化信息。排除标准:(1)图像质量不佳者;(2)未做
15、DCE-MRI者。2.景影像学资料采集采用联影3.0 T磁共振成像仪(UMR7903.0T,上海联影公司),10 通道乳腺相控线圈。扫描体位:俯卧位,胸壁紧贴线圈,双乳自然悬垂于乳腺线圈内。扫描序列及扫描参数:横断位T1WI动态对比增强MRI,T E=2.17 m s,T R=5.15 m s,层厚1 mm,翻转角10,层数12 8,视野340 mmx340mm,矩阵336x100。增强前先扫蒙片,再利用高压注射器以2.5mL/s速率,于肘正中静脉注射Gd-DOTA(佳迪显,江苏恒瑞医药股份有限公司),剂量0.2 mmol/kg,注射后以同样速率注射2 0 mL生理盐水,注射完毕后行8 期连续
16、动态扫描,每期扫描6 9s。3.靶区勾画及特征提取2名具有10 年工作经验的影像诊断医生在对患者病理结果不知情的情况下应用3Dslicer软件对病灶进行勾画,其中一名医生在DCE-MRI第二期的横断位上勾画感兴趣区(region of interest,R O I)(图1),另一名医生随机选取50%的患者进行勾画,对于多病灶患者,勾画时选取最大的单个病灶进行勾画。应用3Dslicer的”Pyradiomics”包对勾画的ROI进行特征提取,每例患者共提取12 2 3个特征(包括一阶特征、纹理特征等)。应用组间相关系数(inter-classcorrelation coefficients,I
17、CC)评估不同观察者之间的一致性,选取ICC0.75的特征进行下一步处理1B图1乳腺癌患者在DCE-MRI第二期的横断位上ROI的勾画A.DCE-MRI;B.勾画病灶的ROI(绿色区域)。4.特征筛选及模型构建提取的影像组学特征,应用单因素分析筛选具有统计学意义(P0.05)的特征,选用最小绝对收缩和选择算子法(least absolute shrinkage and selectionoperator,L A SSO)筛选特征后,为减小休斯效应,应用递归特征消除余(recursivefeatureelimination,ChinComputMedImag,22024,30(1)41中国医学计
18、算机成像杂志2 0 2 4年第30 卷第1期RFE)按照特征的重要性进行排序,选取不同数量特征8 ;提取的特征分别使用k最近邻(k-nearestneighbor,K NN)、支持向量机(support vectormachine,SVM)、逻辑回归(logistic regression,LR)、决策树(decision tree,D T)和随机森林(r a n d o m f o r e s t,R F)构建预测浸润性乳腺癌Ki-67表达状态的影像组学模型,每个模型均通过网格搜索来确定最佳参数。采用合成少数类过采样技术(synthetic minority oversampling tec
19、hnique,SMOTE)进行数据均衡,避免数据不均衡导致模型性能下降9;计算不同模型的受试者工作特征曲线下面积(a r e a u n d e r t h e c u r v e,A U C),并应用准确率和F1度量值对模型进行评估,绘制校正曲线评估模型拟合度,应用DeLong检验比较不同模型的性能。5.组织病理及免疫组化分析所有患者均行组织病理活检,免疫组化信息完整,检测结果由病理科医师进行判读。雌激素受体(estrogen receptor,ER)、孕激素受体(progesteronereceptor,PR)细胞核染色1%时即判定为阳性;Ki-67表达状态以癌细胞中的核染色阳性细胞所占的
20、百分比表示。Ki-67 2 0%的患者预后明显变差【10 ,且中国抗癌协会乳腺癌专业委员会推荐以2 0%30%对Ki-67高低表达进行区分1,本研究以2 0%为标准,Ki-6720%为高表达(10 4例)。6.统计学分析采用SPSS25.0和python语言(版本3.9.13)进行统计学分析,对于正态分布的计量资料,以社s表示,两组间比较采用独立样本t检验;对于计数资料,两组间比较采用检验。P0.05为差异有统计学意义。结果1.基本临床信息156例患者中,Ki-67高表达组10 4例,年龄为(52.0 9.9)岁,低表达组52 例,年龄为(51.59.3)岁。Ki-67高表达组和Ki-67低表
21、达组的ER、PR 表达差异均有统计学意义(P0.05),年龄和绝经状态无统计学意义,见表1。表1Ki-67高表达与低表达组的临床病理资料比较年龄(士绝经状态(例)ER(例)PR(例)组别例数s)/岁未绝经绝经阴性 阳性阴性阳性高表达10452.09.9436140646341低表达5251.59.323297451834Xt值0.2510.11810.2929.360P值0.8020.7310.0010.0202.不同特征数及机器学习算法预测Ki-67表达状态选取ICC0.75的1153个特征进行下一步的特征筛选,应用单因素分析选取7 8 个具有统计学意义(P 0.0 5)的特征,进一步应用7
22、 折交叉验证的LASSO(图2)和RFE进行特征筛选,分别选取3、5、7、10、13个特征,LASSO选择的特征间的相关性见图3;最后应用KNN、L R、D T、SVM 和RF构建模型来预测浸润性乳腺癌Ki-67表达状态,不同特征数及机器学习模型经5折交叉验证确定其训练集和测试集的AUC、准确率和F1度量值直(表2)。0.120.100.080.060.040.020-0.02-0.0410-310-210-110010110210310-310-210-1100101102103LambdaLambda2A2B图2 LASSO进行特征选择A.不同lambda下每一折交叉验证的均方误差(MSE
23、)结果;B.LASSO回归筛选特征的特征系数收敛图,不同lambda下每一折交叉验证的MSE的值。42ChinComputMedImag,2024,30(1)中国医学计算机成像杂志2 0 2 4年第30 卷第1期1.0Featurecorrelationx13xl:log-sigma-O-5-mm-3D-glcm-MCCx120.8x2:log-sigma-O-5-mm-3D-gldm-DependenceVariancex11x3:log-sigma-1-O-mm-3D-glcm-lmcl0.6x10 x4:log-sigma-1-5-mm-3D-glrlm-LongRunLowGrayLe
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 基于 不同 机器 学习 算法 影像 模型 预测 浸润 乳腺癌 Ki 67 表达 价值
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【自信****多点】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【自信****多点】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。