基于Transformer增强卷积的膝关节磁共振影像年龄预测.pdf
《基于Transformer增强卷积的膝关节磁共振影像年龄预测.pdf》由会员分享,可在线阅读,更多相关《基于Transformer增强卷积的膝关节磁共振影像年龄预测.pdf(11页珍藏版)》请在咨信网上搜索。
1、2023年9月第6 0 卷第5期四川大学学报(自然科学版)Journal of Sichuan University(Natural Science Edition)Sep.2023Vol.60No.5基于 Transformer 增强卷积的膝关节磁共振影像年龄预测朱昊哲1,邓小冬,廖培希3,杜文超1,陈怀歆4,刘洪1.4,陈虎1,邓振华,杨红雨1.4(1.四川大学计算机学院,成都6 10 0 6 5;2.四川大学华西基础医学院与法医学院,成都6 10 0 41;3.成都市第六人民医院,成都6 10 0 51;4.四川大学视觉合成图形图像技术重点学科实验室,成都6 10 0 6 5)摘要:年龄
2、预测是临床医学中的一个重要课题和非常活跃的研究领域.最近,由于传统影像学检查中电离辐射的缺点,越来越多的研究使用磁共振影像进行年龄预测。本文基于膝关节MRI数据集,提出了一种新的端到端网络,结合卷积神经网络和Masked-Transformer网络互补地来提取局部特征和全局依赖,并使用一个特征聚合模块来聚合不同局部膝关节MRI切片的特征.通过整合卷积神经网络的特征图和视觉Transformer分支的特征编码,特征提取模块可以互补地提取局部和全局信息,更好地提取与年龄相关的特征。同时,该网络使用由图注意力网络组成的特征聚合模块,用于在特征级别集成不同MRI切片的局部特征,实现多切片局部特征之间的
3、交互.大量实验表明,该方法可以在膝关节MRI年龄估计任务中达到最先进的性能.具体而言,本文方法在MRI数据集上进行了测试,该测试集包括44个年龄在12.0 25.9岁之间的膝关节MRI样本,其中五折交叉验证的最佳结果是年龄平均绝对误差为1.571.34 岁.关键词:深度学习;膝关节年龄预测;核磁共振影像;计算机辅助诊断中图分类号:TP389.1Transformer enhanced convolution based knee age estimation on MRIs文献标识码:ADOI:10.19907/j.0490-6756.2023.052001ZHUHao-Zhe,DENG Xi
4、ao-Dong,LIAO Pei-Xi?,DU Wen-Chao,CHEN Huai-Xin*,LIU Hong l.4,CHEN Hu,DENG Zhen-Hua?,YANG Hong-Yu 1.4(1.College of Computer Science,Sichuan University,Chengdu 610065,China;2.West China School of Basic Medical Sciences and Forensic Medicine,Sichuan University,Chengdu 610041,China;3.The Sixth Peoples H
5、ospital of Chengdu,Chengdu 610051,China;4.Department of National Key Laboratory of Fundamental Science onSynthetic Vision,Sichuan University,Chengdu 610065,China)Abstract:Age estimation is regarded as a crucial topic and a very active research field in clinical medi-cine.Recently,due to the drawback
6、 of ionizing radiation from the traditional imageological examination,收稿日期:2 0 2 2-11-30基金项目:四川省卫生健康委员会科研课题(19PJ007);成都市卫生健康委员会科研课题(2 0 2 2 0 53);四川省自然科学基金(2 0 2 2 NSFSC12 8 6);成都市重点研发支撑计划项目(2 0 2 1YF0501788SN)作者简介:朱昊哲(2 0 0 0 一),男,湖北武汉人,硕士研究生,主要研究方向为医学图像处理。E-mail;z z z h z s t u.s c u.e d u.c n通讯作者
7、:陈虎.E-mail:h u c h e n s c u.e d u.c n052001-1第6 0 卷growing more and more studies have focused on using magnetic resonance imaging(MRI)for bone ageprediction.This paper proposes a novel end-to-end network based on the knee MRI dataset,which com-bines the convolution neural network(CNN)and Masked-Tra
8、nsformer network to extract complementa-ry features,and uses a feature aggregation module to aggregate features of different local knee MRIslices.By integrating the feature maps of CNN and the patch embeddings of visual transformer bran-ches,the feature extraction module can complementarily acquire
9、local and global information to betterextract age-related features.A feature aggregation module composed of the graph attention network isproposed in our work to integrate the local features of different MRI slices at the feature level to achievethe interaction between multiple slice features.Extens
10、ive experiments demonstrate that our method canachieve state-of-the-art performance in the knee MRI age estimation task.Specifically,our method istested on a dataset including 44 knee MRI samples aging from 12.0 to 25.9 years,and the best result offive-fold cross-validation is a mean absolute error
11、of 1.57 1.34 years in age regression.Keywords:Deep learning;Knee age estimation;Magnetic resonance imaging;Computeraided diagnosis基于卷积网络和Transformer结构的优势和1 引 言特点,本文提出了ResMAE网络结构.该网络由年龄预测在临床医学和放射学中是一个重要Masked-Transformer模块增强的卷积神经网络基的研究领域1-2 ,可用于诊断内分泌疾病、判断青少本块组成,用于从每个膝关节MRI样本的图像切年发育时间点以及规划骨科手术干预时间点3-4
12、。片中提取与年龄相关的特征.在提取到图像特征之现有的人工年龄预测的方法,诸如Greulich and后,应用一个由图注意力网络结构组成的特征聚合Pyle(GP)5和 Tanner Whitehouse 2(TW2)6 等模块实现各MRI切片特征的聚合,以输人到全连方法对于手腕部医学图像中骨骼生长板骨化状况接层和Softmax层中得到预测的年龄结果.本文的进行分级对照,从而预测出样本的年龄.参考GP贡献主要包括:(1)本文提出了一种新的端到端网和TW2方法,许多研究7-14总结了人工对于膝关络,用于处理膝关节MRI年龄预测任务,该网络显节X光图像或MRI图像进行年龄预测的方法,从著提高了其在膝关
13、节MRI 的年龄预测任务的性能股骨远端、胫骨近端和骨近端三个部位15获取效果,并实现了临床应用的可行性;(2)本文提出年龄相关信息.然而,传统的膝关节年龄预测方法了一种Masked-Transformer增强的卷积特征提取需要专业放射科医生手动完成,这可能导致主观误网络结构.实验证明该网络在膝关节MRI年龄预差和低准确性.因此,需要开发基于深度学习技术测任务中比全卷积结构和全视觉Transformer结的自动化算法来提高年龄预测的效率和准确性.构具有更好的结果;(3)本文在局部MRI切片特最近的研究16-18 利用卷积神经网络对膝关节征级别上使用了图注意力网络19作为特征聚合模MRI进行年龄预
14、测.这些方法将每个MRI样本看块.实验表明,相比原始的基于每个切片预测结果作多层面的二维图像,并使用共享参数的卷积神经的机器学习聚合方法,该方法表现更佳;(4)通过网络和全连接层提取具有年龄相关性的特征信息,详细的实验结果证明,本文方法在可解释性、时间以预测每个切片的年龄并加权得到最终的年龄预效率和性能方面均优于人工膝关节MRI年龄预测测结果.尽管卷积神经网络在该任务中表现良好,方法和现有深度学习方法.但仍难以获取所有MRI切片的全局相关信息,在2膝关节核磁共振相关研究该项年龄预测任务中存在局限性。自注意力模型近年来在计算机视觉领域得到广泛应用,尤其在图像识别、图像分割和目标检测等任务中表现突
15、出.视觉Transformer模块通过捕获图像的全局依赖,在处理全局信息方面具有优势,这与卷积神经网络在处理局部细节方面的优势相互补充。四川大学学报(自然科学版)2.1膝关节年龄预测近期的研究16-18 采用深度学习技术对膝关节MRI图像进行年龄估计.这些方法将每个MRI切片看作一张二维图像,使用二维卷积神经网络和全连接层提取与年龄相关的特征信息,并使用机器学习方法预测每个切片的年龄并加权平均得到最终052001-2第5期第5期的年龄结果.然而,卷积神经网络虽然能够有效地提取局部特征,但在捕获所有MRI切片的全局依赖信息方面存在困难.同时,由于未考虑到不同切片之间的关系,直接将不同切片的年龄结
16、果反馈到另一个机器学习回归函数中进行最终的年龄估计也不可靠。具体而言,Dallora等人16 使用GoogLeNet20和全连接层进行膝关节MRI切片图像的特征提取和年龄回归预测.Proove等人17 引入U-Net结构2 1从膝关节MRI切片图像中分割出骨骼部分,用U-Net编码器提取骨骼掩膜图像中的特征,并将每个切片的年龄预测结果输人到随机森林回归函数中得到最终年龄结果.Mauer等人18 使用AgeNet2D从局部膝关节MRI切片提取特征,并应用极端随机树回归器对每个切片的预测结果进行加权,以在其私人数据集中获得最佳预测结果.然而,这些方法都采用两阶段方法,即使用二维卷积神经结构提取每个
17、MRI图像切片的特征,并将每个切片的预测结果直接加权以获得最终年龄相比之下,本文提出了一种新的方法,使用视觉Transformer结构对膝关节MRI数据进行特征提取,以提高年龄预测的准确性。与现有解决方案相比,本文方法从全局角度提取更多与年龄相关的特征,并使用由图注意力网络结构组成的特征聚合模块在特征层面实现各切片特征的聚合,从而更好地考虑了不同局部切片之间的相关性.此外,本文的方法以端到端的方式实现,实现起来更加方便,并在后续实验中证明了其在预测性能上的优越性.2.2卷积神经网络卷积神经网络在计算机视觉任务中表现惊人,其在膝关节 MRI年龄预测任务中也不例外.Res-Net221作为一个具有
18、里程碑意义的深度卷积神经网络模型.过去,研究人员一直认为神经网络的深度对卷积神经网络的性能和拟合能力至关重要,因此一直通过增加层数来改进神经网络模型.但是He等人2 2 证明,当网络深度增加到一定程度时,网络的拟合能力可能会下降.因此,ResNet使用跳跃连接来解决过拟合问题并加速训练.由于Res-Net在特征提取方面的出色能力,本文选择Res-Net作为该任务的主干网络.考虑到本文的训练数据集相对较小且图像分辨率相对较低,因此选择参数较少的ResNet34网络结构作为主干网络,以缓解过度拟合现象.朱昊哲,等:基于Transformer增强卷积的膝关节磁共振影像年龄预测第6 0 卷2.3Tra
19、nsformer模块Transformer231模块一直被广泛应用于NLP任务中.最近ViT24I的出现证明了在视觉任务中使用Transformer结构的可行性,并展示了其在全局特征提取方面的优势.视觉Transformer网络通过将每个图像分割成带有位置编码信息的特征来构建一系列特征编码,并使用串联的Transformer模块提取参数化向量作为全局视觉表示.然而,全Transformer网络结构可能会忽略图像的局部特征细节,并且在数据量不足的情况下训练时的泛化性能较差.为了应对这些问题,近期许多工作着力于使用Transformer结构来增强卷积主干网络,提高网络的整体性能.具体而言,Dai等
20、人2 5提出了CoAtNet网络结构,以结合卷积神经网络和Transformer模块的优点.他们发现,深度卷积结构和自注意力机制可以自然地统一结合,并在浅层中更有效地垂直堆叠卷积和自注意力层.Conformer26使用并行混合的卷积神经网络结构和Transformer块,以利用卷积运算和自注意力机制来增强网络的泛化能力.与现有工作不同,本文考虑到更好地提取所有MRI切片的全局特征和局部切片特征,在Res-MAE的ResNet基本块的基础上,加人了类似于MAE27的编码器结构的Masked-Transformer结构,以将具有年龄相关性的全局信息融人切片图像特征提取中.同时,Masked-Tra
21、nsformer结构随机地对一些图像区域进行遮蔽操作,以此减轻Transformer结构产生的过拟合现象.后续部分将详细介绍本文所提出的ResMAE模块,并通过综合实验证明,ResMAE中的特征提取模块显著提高了膝关节MRI年龄预测任务的精度,在预测时间和精度方面都能满足临床应用需要。3方法本节将介绍用于膝关节MRI年龄估计任务的特征提取网络和特征聚合模块.整体网络结构如图1所示,网络的输入为12 张二维切片图像,经过初始的3个卷积网络块得到浅层特征,接着输入到4个级联的基本块进行特征提取并得到每张图像的高级语义特征向量.最后,本文通过特征聚合模块(Feature Aggregation Mo
22、dule,FAM)将各切片的特征向量进行聚合,得到年龄相关性最强的切片特征,并使用全连接层和Softmax层输出预测年龄.052001-3第6 0 卷四川大学学报(自然科学版)第5期Fully Connected LayerFealure三SSoftmaxLayerSas1cSICasicFealureFeatureAggregationBlockFeatureFeatyreAge图1ResMAE网络结构图Fig.1 ResMAE network structure diagram基于图1中的网络结构,我们来解释本文如何结合卷积神经网络和Transformer模块的优点来进行特征提取.同时,本
23、文还介绍了如何使用Masked-Transformer模块以减轻过拟合现象,并展示了如何应用特征聚合模块对提取到的切片特征在特征层面进行聚合.3.1基于Transformer模块的特征提取网络本节详细介绍了用于膝关节MRI切片特征提取的网络结构,如图2 所示.与ResNet22结构相似,本文的特征提取网络针对膝关节年龄预测任务进行了修改.首先,为了避免图像细节的丢失,本文在网络的初始部分应用3个33的卷积块进行初始特征提取过程,将初始输人图像转换为具有初级语义特征的特征图.基本块的整体卷积结构与ResNet34结构类似,每个卷积块的卷积核大小为3X3,padding为1,并在其后跟随有一个Ba
24、tchNo-rm层和ReLU激活层.ConvBlockConvBlockConvBlockBasicBlockBasicBlockBasicBlockBasicBlockBasicBlockBasicBlockBasicBlockBasicBlockBasicBlockBasicBlockBasicBlockBasicBlockBasicBlockBasicBlockBasicBlockBasicBlockFeatureConv BlockConv Block-BlockTransformerMasked?:Add:ConcatLayerNormSelf-attention BlockMult
25、i-headPositionalEmbeddingAverageRandomMaskingPoolingLayerNormSelf-attention BlockProjectiorMulti-headReshapeMLPwithMaskTokenInterpolate2图2 基本块网络结构图Fig.2 Basic block network structure diagram此外,如图2 右上部分所示,本文在ResNet基本块的第二个卷积块后添加了一个Masked-Transformer模块,以更好地融合Transformer模块的全局依赖,实现更好的特征提取过程。Masked-Transf
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 基于 Transformer 增强 卷积 膝关节 磁共振 影像 年龄 预测
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,个别因单元格分列造成显示页码不一将协商解决,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【自信****多点】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【自信****多点】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。