基于深度学习的胰腺黏液性和浆液性囊性肿瘤的多源特征分类模型.pdf
《基于深度学习的胰腺黏液性和浆液性囊性肿瘤的多源特征分类模型.pdf》由会员分享,可在线阅读,更多相关《基于深度学习的胰腺黏液性和浆液性囊性肿瘤的多源特征分类模型.pdf(11页珍藏版)》请在咨信网上搜索。
1、 Chinese J Magn Reson,2024,41(1):19-29 第 41 卷第 1 期 2024 年 03 月 Vol.41 No.1 Mar.2024 波波 谱谱 学学 杂杂 志志 Chinese Journal of Magnetic Resonance doi:10.11938/cjmr20233064 基于深度学习的胰腺黏液性和浆液性囊性肿瘤的多源特征分类模型 徐真顺1,袁小涵2,黄子珩1,邵成伟2,武杰1#,边云2*1.健康科学与工程学院,上海理工大学,上海 200093;2.长海医院放射科,海军军医大学,上海 200434 摘 要:术前精准预测胰腺囊性肿瘤的类型,对制
2、定个体化诊疗方案具有重要的临床价值针对胰腺浆液性和黏液性囊性肿瘤的分类鉴别问题,本文探讨了基于深度学习的多源特征分类模型在胰腺囊性肿瘤的术前辅助诊断中的应用首先,通过深度学习和影像组学技术从分割图像中提取深度学习特征和影像组学特征,并对病例的临床特征进行评估和量化,然后采用最小绝对收缩选择算子(LASSO)及交叉验证的方法筛选特征,随之构建出两个多源特征模型,即影像组学联合深度学习(RAD_DL)模型、临床特征联合 RAD_DL(Clinical_RAD_DL)模型,把传统的影像组学(RAD)模型和深度学习(DL)模型作为对照,最后选用支持向量机(SVM)、自适应提升算法(ADAboost)、
3、随机森林(Random Forest)以及逻辑回归(Logistic)进行分类采用准确率、召回率、精确率、曲线下面积(AUC)值以及精确率和召回率的调和平均数(F1 值)作为评价指标,比较上述 4 种不同特征模型的分类效能,用校准曲线和决策曲线来评估其临床应用价值结果显示 Clinical_RAD_DL 特征模型的分类效能表现最佳,准确率是 0.923 1,召回率是 0.882 4,精确率是 0.882 0,F1 是 0.882 2,AUC 是 0.912 6,校准曲线和决策曲线显示出 Clinical_RAD_DL 特征模型的临床应用价值是最高的 实验表明基于深度学习的多源特征分类模型,对胰
4、腺黏液性和浆液性囊性肿瘤具有较好的分类效果,可以为临床上精准诊疗提供帮助 关键词:磁共振成像(MRI);胰腺囊性肿瘤;临床特征;深度学习;影像组学 中图分类号:O482.53 文献标识码:A Multi-source Feature Classification Model of Pancreatic Mucinous and Serous Cystic Neoplasms Based on Deep Learning XU Zhenshun1,YUAN Xiaohan2,HUANG Ziheng1,SHAO Chengwei2,WU Jie1#,BIAN Yun2*1.School of H
5、ealth Science and Engineering,University of Shanghai for Science and Technology,Shanghai,200093,China;2.Department of Radiology,Changhai Hospital,The Navy Military Medical University,Shanghai,200434,China Abstract:This study aims to classify and differentiate mucinous and serous cystic neoplasms of
6、the pancreas using a multi-source feature classification model based on deep learning for preoperative auxiliary diagnosis.Deep learning features and radiomics features were extracted from segmented images using deep learning and radiomics technology,respectively.Clinical features were also evaluate
7、d and quantified.LASSO(least absolute shrinkage and selection operator)and cross-validation methods were applied to screen the features,and two multi-source feature models were constructed:the radiomics combined with deep learning(RAD_DL)model and the clinical feature combined with RAD_DL(Clinical_R
8、AD_DL)model.Traditional radiomics(RAD)and deep learning(DL)models were used as controls.SVM(support vector machine),ADAboost(adaptive boosting),Random Forest,and Logistic were selected for classification.The Clinical_RAD_DL feature model shows the best classification performance,with the accuracy of
9、 0.923 1,recall rate of 0.882 4,precision of 0.882 0,F1-score of 0.882 2,and AUC value of 0.912 6.The experimental results indicate that the multi-source feature classification model based on deep learning has good performance in classifying pancreatic serous cystic neoplasms and pancreatic mucinous
10、 cystic neoplasms,and can assist clinical accurate diagnosis and treatment.Keywords:magnetic resonance imaging(MRI),pancreatic cystic neoplasms,clinical features,deep learning,radiomics 收稿日期收稿日期:2023-04-19;在线在线发表发表日期日期:2023-06-08 通信通信作者作者(Corresponding author):#Tel:021-55271116,E-mail:;*Tel:021-3116
11、6666,E-mail:.20 波 谱 学 杂 志 第 41 卷 引 言 随着腹部横断面成像的普及,胰腺囊性肿瘤(PCN)的检出率也呈逐年上升的趋势中国胰腺囊性肿瘤诊断指南中指出,51.1%的患者缺乏典型的胰腺疾病相关症状1,这就为疾病的早期诊疗带来了困难而且,部分 PCN 具有恶变的风险,其中,胰腺浆液性囊性肿瘤(SCN)一般为良性,胰腺黏液性囊性肿瘤(MCN)具有恶变潜能,二者的术前精确诊断对于制定个性化评估方案具有重要意义据 2023 年癌症统计数据报道,胰腺癌的死亡率是最高的MCN 和 SCN 的精确分类,对于胰腺良恶性肿瘤的早期诊疗具有重要的临床意义,同时为良性患者避免不必要的手术切
12、除 磁共振成像(MRI)是评估 PCN 的首要成像方式,医生的诊断依据取决于 MRI 的形态特征目前,MCN 和 SCN 人工分类主要有两个难点:首先,MCN 和 SCN 前期并没有胰腺疾病相关的症状,大多患者是偶然发现,这为临床上的早期确诊带来困难;再者,MCN 和 SCN 的影像学特征相似,二者差异较小,容易引起误诊临床上,传统的 PCN 分类很大程度上依赖于医生的经验,而仅凭临床症状和影像学特征无法对 PCN 进行准确的检测和诊断,且医生手工分类主观性较强,不同的医生诊断结果可能存在差异2,3,因此结合计算机技术辅助医生诊断的需求日益增长 近年来,基于深度学习和影像组学的方法是研究 PC
13、N 良恶性的热点4最近的研究发现,深度学习和影像组学对胰腺肿瘤的个体化评估有很大贡献,如肿瘤检测、分类以及良恶性判别等5-10 Zhang 等11开发并验证了基于卷积神经网络(CNN)的迁移学习模型,该模型使用两个独立的可切除胰腺导管腺癌(PDAC)队列来预测 PDAC 患者的总体生存Nguon 等9使用残差网络(ResNet50)实现了一个区分 MCN 和 SCN 的CNN 模型 当训练选定的层时,使用预训练的迁移学习模型进行微调训练 该网络模型的准确率为 0.827 5,曲线下面积(AUC)得分为 0.88尽管这些发现证实了深度学习和影像组学用于评估 PCN 的可行性7,12,但由于大多数
14、研究中包含的数据集较少,且研究的方法较为单一,使得影像组学模型的适用性可能受到限制因此,胰腺囊性病变需要积累更多的研究数据 以往的研究大多是单独使用影像组学的方法,或者单独使用深度学习的方法,对 MCN 和 SCN 进行分类,虽然都展现出了较好的分类能力,但二者之间是否存在互补的关系还有待研究本研究旨在构建基于深度学习的多源图像特征分类模型,以区分 MCN 和 SCN,对患者进行个体化评估 1 实验部分 1.1 一般资料 本研究使用的数据集来自长海医院在 2011 年至 2021 年期间接收的 172 例 PCN 患者,其中包含 65 个MCN 病例以及 107 个 SCN 病例,所有患者均提
15、供书面知情同意书经病理学证实的 107 例 SCN 患者有男性 45 例,女性 62 例,平均年龄(48.715.1)岁,65 例 MCN 患者中有男性 23 例,女性 42 例,平均年龄为(51.912.5)岁 1.2 MRI 扫描 所有患者均使用 3.0 T 系统(Signa Excite 3.0T,GE Healthcare,Milwaukee,USA)进行 MRI 检查所有患者仰卧位,相控阵接收器线圈覆盖上腹部,屏气单次快速自旋回波轴位 T2 加权序列(TR/TE=6 316/87 ms;视野=360 420 mm2;矩阵=224 270;层厚=5 mm;层间距=1 mm)评估所有 P
16、CN 的 MRI 临床特征:(A)肿瘤的位置(胰头、胰体和胰尾);(B)大小(感兴趣区(ROI)的像素体积);(C)患者性别;(D)患者年龄(连续变量),将这些临床特征作为初步的诊断依据 第 1 期 21 徐真顺等:基于深度学习的胰腺黏液性和浆液性囊性肿瘤的多源特征分类模型 1.3 基于深度学习的多源特征分类方法 在 MCN 和 SCN 的分类模型当中,使用深度学习特征联合影像组学特征集构建 RAD_DL 多源特征模型,使用添加了临床特征的 RAD_DL 特征集构建 Clinical_RAD_DL 多源特征模型为了探究多源特征分类模型的效能,还使用深度学习特征和传统影像组学特征构建 DL 特征
17、模型和 RAD 特征模型此外,还分别使用 SVM、ADAboost、Random Forest 和 Logistic 分类器来训练 4 种特征模型,使用准确度、召回率、精确率、AUC 和 F1 值等指标评估 4 种特征模型的分类效能本研究的流程图如图 1 所示 图 1 基于深度学习的多源特征模型建模流程 Fig.1 Experimental workflow of multi-source feature model based on deep learning 1.3.1 图像分割图像分割 肿瘤的分割在 ITK-snap(版本 3.8.0)软件上进行,所有 MR 图像都由 3 名经长海医院委
18、员会认证的腹部放射科医生分析,在肿瘤的最大横断面上绘制 ROI,在绘制 ROI 时需特别注意避免胰腺血管、导管和伪影为了减少 ROI 分割的误差,由不同的放射科医生独立对图像进行分割,再由十年腹部诊断经验的医师进行评定图 2(a)和图 2(b)分别是 MCN 和 SCN 的分割图像 图 2 MCN 和 SCN 的分割图像.(a)腹腔轴位 T2WI 显示 MCN 呈高信号,其边界规则;(b)腹腔轴位 T2WI 显示 SCN 呈高信号,其边界不规则 Fig.2 Segmentation images of MCN and SCN.(a)Abdominal axial T2WI showed hig
19、h MCN signal with regular boundary.(b)Abdominal axial T2WI showed high SCN signal with irregular boundary F1AUC(a)(b)22 波 谱 学 杂 志 第 41 卷 1.3.2 深度学习特征及影像组学特征提取深度学习特征及影像组学特征提取 本研究基于 ResNet50 网络来提取深度学习特征,采用 python 软件包 TensorFlow(版本 2.1.0)的 keras(版本 2.3.1)下的 ResNet50 构建 CNN 网络ResNet50 由残差模块(residual mod
20、ule)组成总共有 50 层,残差模块包括 3 个卷积层,其中包括标准的卷积层、批量归一化层和激活层,可以实现对输入特征映射的高速和高质量转换,通过避免较浅层特征的丢失,可以更好的提取图像对深层特征13,其主要思想是通过残差连接来解决网络过深而出现的梯度消失问题14胰腺在图像中没有固定的形态,结构极为复杂,ResNet50 网络因其深度、高度分层和卷积模块的设计,在提取 PCN 的深度学习特征时,有着明显的优势ResNet50 的网络结构如图 2 所示在预训练中加入迁移学习,减少模型过拟合对该网络随机初始化各层的参数,学习率为 0.000 1,衰减率为 0.000 1,批数据大小为 20,动量
21、为 0.9,训练了 1 000 个循环 图 2 ResNet50 提取深度学习特征过程,图中包含 4 个卷积块(Conv)、平均池化层(Av-pool)以及全连接层(fc)Fig.2 The process of ResNet50 extracting deep learning features,which includes four convolution blocks(Conv),average pooling layer(Av-pool)and fully connected layer(fc)影像组学特征类型包括 20 个形状(Shape)特征、18 个一阶(First order)
22、特征、24 个灰度共生矩阵(gray level co-occurrence matrix,GLCM)、14 个灰度相关矩阵(gray level dependence matrix,GLDM)、16 个灰度游程矩阵(gray level run length matrix,GLRLM)、16 个灰度区域大小矩阵(gray level size zone matrix,GLSZM)和 5 个邻域灰度差矩阵(neighborhood gray tone difference matrix,NGTDM)共 7 类特征以及小波变换特征 使用 3D-slicer 软件中的 pyradiomics 插件
23、对 ROI 提取影像组学特征,软件提取的特征包含 113个原始图像纹理特征和 744 个小波变换特征共 857 个特征 1.3.3 标准化及特征筛选标准化及特征筛选 使用 SPSS25.0 软件对临床资料做单因素逻辑回归分析和多因素逻辑回归分析,将临床资料中既符合单因素逻辑回归分析又符合多因素逻辑回归分析的特征纳入到后续处理利用 python3.9 将影像组学特征及深度学习特征分别进行标准化处理12,应用 LASSO 对影像组学特征和深度学习特征分别进行筛选,10折交叉验证的方法用来寻找训练集中最优的拟合参数(表示 L1 正则化的惩罚力度)LASSO 的主要原则是通过最小化正则化之后的损失函数
24、,实现对回归系数的稀疏化,保留对目标变量的预测具有显著影响的特征LASSO 的损失函数如(1)式所示:2211(LASSO)|()|2LX wywn=+(1)其中,n 表示样本数,X 表示样本目标向量,w 表示 L1 正则化,y 表示样本特征矩阵(1)式右边的第 1 项是 LASSO 的均方误差(mean square error,MSE),第 2 项是添加了 L1 正则化的惩罚因子,通过调整值,控制 L1 正则化程度,使 LASSO 模型的 MSE 最小化以确定最佳的系数估计,保留对结果影响较大的特征,第 1 期 23 徐真顺等:基于深度学习的胰腺黏液性和浆液性囊性肿瘤的多源特征分类模型 其
25、余系数衰减为 0 1.3.4 基于深度学习的多源特征模型构建基于深度学习的多源特征模型构建与与评估评估 使用 pycharm2018 软件构建分类模型并对模型进行评估将患者按照约 7:3 划分为训练集(n=120)和测试集(n=52),将筛选获得的数据集构建 RAD、DL、RAD_DL 以及 Clinical_RAD_DL 特征模型使用SVM、ADAboost、Random Forest 以及 Logistic Regression 分类器进行分类,采用网格搜索和控制变量结合的方法优化各分类器的参数,使用准确率(Accuracy)、召回率(Recall)、精确率(Precision)以及 F1
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 基于 深度 学习 胰腺 黏液 浆液 性囊性 肿瘤 特征 分类 模型
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,个别因单元格分列造成显示页码不一将协商解决,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【自信****多点】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【自信****多点】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。