深度迁移学习在青光眼自动分类中的应用_赵琳娜.pdf
《深度迁移学习在青光眼自动分类中的应用_赵琳娜.pdf》由会员分享,可在线阅读,更多相关《深度迁移学习在青光眼自动分类中的应用_赵琳娜.pdf(7页珍藏版)》请在咨信网上搜索。
1、哈尔滨工程大学学报 Journal of Harbin Engineering University ISSN 1006-7043,CN 23-1390/U 哈尔滨工程大学学报网络首发论文哈尔滨工程大学学报网络首发论文 题目:深度迁移学习在青光眼自动分类中的应用 作者:赵琳娜,徐曦,李建强,赵青 收稿日期:2021-12-14 网络首发日期:2022-12-29 引用格式:赵琳娜,徐曦,李建强,赵青深度迁移学习在青光眼自动分类中的应用J/OL哈尔滨工程大学学报.https:/ 网络首发网络首发:在编辑部工作流程中,稿件从录用到出版要经历录用定稿、排版定稿、整期汇编定稿等阶段。录用定稿指内容已经
2、确定,且通过同行评议、主编终审同意刊用的稿件。排版定稿指录用定稿按照期刊特定版式(包括网络呈现版式)排版后的稿件,可暂不确定出版年、卷、期和页码。整期汇编定稿指出版年、卷、期、页码均已确定的印刷或数字出版的整期汇编稿件。录用定稿网络首发稿件内容必须符合出版管理条例和期刊出版管理规定的有关规定;学术研究成果具有创新性、科学性和先进性,符合编辑部对刊文的录用要求,不存在学术不端行为及其他侵权行为;稿件内容应基本符合国家有关书刊编辑、出版的技术标准,正确使用和统一规范语言文字、符号、数字、外文字母、法定计量单位及地图标注等。为确保录用定稿网络首发的严肃性,录用定稿一经发布,不得修改论文题目、作者、机
3、构名称和学术内容,只可基于编辑规范进行少量文字的修改。出版确认出版确认:纸质期刊编辑部通过与中国学术期刊(光盘版)电子杂志社有限公司签约,在中国学术期刊(网络版)出版传播平台上创办与纸质期刊内容一致的网络版,以单篇或整期出版形式,在印刷出版之前刊发论文的录用定稿、排版定稿、整期汇编定稿。因为中国学术期刊(网络版)是国家新闻出版广电总局批准的网络连续型出版物(ISSN 2096-4188,CN 11-6037/Z),所以签约期刊的网络版上网络首发论文视为正式出版。哈 尔 滨 工 程 大 学 学 报 Journal of Harbin Engineering University 深度迁移学习在青
4、光眼自动分类中的应用 赵琳娜,徐曦,李建强,赵青(北京工业大学 信息学部,北京 100124)摘 要:针对现有青光眼诊断方法严重依赖于训练数据集规模的问题,本文提出一种深度迁移网络来进行青光眼自动诊断,能够在有限监督下捕获更好地描述与青光眼相关的判别特征。采用卷积神经网络从相似的眼科疾病数据集中迁移一般特征,并采用最大平均差异方法来缩小特征差距并细化特异特征。在真实场景数据集上进行实验,验证所提方法的有效性。与其他模型相比,本文方法取得 91.15%的准确率,90.13%的灵敏度,92.25%的特异性,其方法对青光眼的早期筛查具有一定的医学价值和意义。关键词:迁移学习;眼病诊断;青光眼;自动分
5、类;卷积神经网络;深度学习;分类;疾病筛查 Doi:10.11990/jheu.202112033 中图分类号:TP311 文献标识码:A Exploiting deep transfer learning for automatic glaucoma detection ZHAO Linna,XU Xi,LI Jianqiang,ZHAO Qing(Beijing University of Technology,Beijing,China)Abstract:Recently,deep learning models based on fundus images have been prop
6、osed for automatic glaucoma detection.The performance of these methods heavily depends on the size of the training set.However,it is expensive and time-consuming to obtain a large number of labeled images in the medical field.In this paper,we propose a deep transfer learning network to automatically
7、 diagnose glaucoma,which can better capture the discriminant glaucoma-related features under limited supervision.Specifically,we first adopt convolutional neural network(CNN)to transfer the general features from similar ophthalmic datasets,and then use the maximum mean discrepancy(MMD)loss to reduce
8、 the feature gap and refine the specific features.To verify the effectiveness of the proposed method,we conducted experiments on real-world datasets.Compared with other models,our method has achieved better classification performance(Accuracy of 91.15%,sensitivity of 90.13%,specificity of 92.25%and
9、AUC of 0.93),which has great significance for the early glaucoma screening.Keywords:transfer learning;ophthalmic disease diagnosis;glaucoma;automatic classification;CNN;deep learning;classification;disease screening 1 引言 青光眼是一种复杂的眼科疾病,因其高发病率而备受医学界的关注1。到 2010 年为止全世界有4470 万人患有青光眼,并预计这一数字在十年内将增加约 50%2,
10、青光眼的致盲率接近 1/3,仅次于白内障3。为了防止疾病进一步恶化(导致视力模糊或失明),对青光眼患者进行早期筛查是十分必要的。目前,在临床上普遍使用彩色眼底数字图像进行青光眼筛查4:眼科医生通常观察眼底图像,并根据某些症状来判断受试者是否患有青光眼5-6,包括大杯盘比、视神经损伤和高眼压。然而,这种基于专业的眼科知识的人工筛查方法对于患者而言,成本昂贵又费时。计算机视觉技术为自动青光眼诊断任务提供了有效的解决方案。目前青光眼自动分类方法主要分为 2 类:基于机器学习的传统方法和深度学习方法。对于基于机器学习的传统方法,大多数工作首先基于医生先验知识来预定义特定眼底特征,再构建分收稿日期收稿日
11、期:2021-12-14.基金项目基金项目:国家自然科学基金项目(81970844).作者简介作者简介:赵琳娜,女,博士研究生;李建强,男,教授,博士生导师 通信作者:通信作者:李建强,E-mail:bjut_.网络首发时间:2022-12-29 11:26:43网络首发地址:https:/ 哈 尔 滨 工 程 大 学 学 报 Journal of Harbin Engineering University 类器进行训练。例如,Yadav 等人7提取视盘区域的纹理特征并训练神经网络来识别青光眼。Nayak等人8则是通过人工设计的几何特征,包括杯盘比和视盘中心距离比等,来训练青光眼分类器。为了进
12、一步改善分类的性能,Mookiah 等人9利用基于高阶谱和纹理的特征组合来构建支持向量机模型。除了以上工作,研究者发现其他特征,如基于能量的特征10、局部结构模式特征11、快速傅立叶变换特征12-13和基于熵的特征14也可用于青光眼的自动分类。由于这些特征符合病理信息,它们在一定程度上能够完成对青光眼的自动诊断。然而,由于疾病的复杂性,这些预先定义的特征对于青光眼的识别可能并不全面。近年来,深度学习在医学领域得到了迅速发展,尤其是基于卷积神经网络(convolutional neural network,CNN)15-18。CNN 通过自身深层次的网络结构能够自主地从高维数据中挖掘全面的隐藏特
13、征,有助于解决传统青光眼分类方法的缺点。陈翔宇等人18首先对原始眼底图像进行预处理,然后训练用于青光眼检测的 CNN 结构。为了获得更好的结果,Shibata 等人19进一步提出了一种基于 ResNet的更深层次的 CNN 模型。在文献20中,付华柱等人提出了一种结合全局图像和局部光盘区域的多流CNN。尽管 CNN 方法在图像任务上能够获得优异的分类结果,仍需要大量的标记数据来训练整个模型,在医学领域受到限制。深度迁移学习方法通过共享不同数据集之间的可迁移特征,将 CNN 的优势推广到有限监督的应用场景下21。虽然目前深度迁移学习在图像任务中的应用非常广泛,但大多数仍然是关于自然图像领域;而在
14、医疗领域中,尤其是对于眼底图像分析的相关工作仍然十分匮乏。本文提出一种深度迁移网络来提取相似的眼科疾病之间的眼底特征,从而在有限监督的情况下达到最佳的青光眼分类性能。将 CNN 网络分为可迁移层和不可迁移层:在可迁移层中,从相似的眼底图像中共享通用特征从而保证通用特征之间的一致性;在不可迁移层中,利用最大平均差异(maximum mean discrepancy,MMD)减小特异特征之间的差异。使得通用特征平稳过渡到特异特征,最终保证在有限的监督下更优越地提取青光眼眼底特征。2 深度迁移网络 在本节中,我们将描述本文提出方法的详细步骤,包括实验数据及相关的预处理方法,眼底特征提取过程以及模型的
15、损失函数。本文提出的基于深度迁移网络的青光眼自动分类模型整体结构如图 1 所示。图 1 青光眼自动分类任务的深度迁移学习方法整体结构 Fig.1 The model architecture of a deep transfer network for the glaucoma detection task 2.1 数据及预处理 本文共采用 2 类数据集,分别为用于目标网络训练的青光眼数据集和用于源网络训练的白内障数据集。2 类数据集都来自北京同仁医院,标签均由专业的眼科医生手动标记给出,患者的年龄分布为2080 岁,其中男性患者占比 47%,女性患者占比53%。第 1 类青光眼数据集共包含
16、1 093 张眼底图像,其中非青光眼样例有 587 张,青光眼样例有 506张,图像分辨率统一为 2196*1740 像素。图 2 为非青光眼和青光眼患者的眼底图像。白内障数据集共包括 18 923 张视网膜眼底图像,其中非白内障样例有 8 923 张、白内障样例有 10 000 张。图 3 为不同程度白内障患者的示例:如图 3(a)所示,非白内障 赵琳娜,等:深度迁移学习在青光眼自动分类中的应用 -3-患者的眼底图像可以清晰地观察到视盘和大小血管的分布;与之相比,白内障患者的眼底图像中(在图 3(b))则是包含的血管细节十分稀疏。图 2 非青光眼和青光眼的眼底图像 Fig.3 Fundus
17、images of non-glaucoma and glaucoma 图 3 非白内障和白内障的眼底图像 Fig.3 Fundus images of non-cataract and cataract 由于数据自身和深度学习网络对输入有一定的要求,本文对上述数据集进行了一系列的预处理操作,主要包括:1)隐私信息处理。本文通过矩形切割和颜色覆盖删除图像上的患者个人信息,以保护其个人隐私;2)图像尺寸统一调整。由于不同数据集之间图像分辨率并不一致,本文统一将所有图像分辨率大小调整为 227*227;3)图像归一化。本文基于 Z-score 的方法对图像进行归一化:式中:x 与代表所有图像像素点
18、的均值和方差。2.2 眼底特征提取 CNN 作为一种深度学习网络的代表,已经被广泛应用于图像识别领域。类似于生物神经网络结构,CNN 拥有权重共享机制可以有效降低模型的复杂度。当网络输入为多维数据,CNN 的这种优势就更加明显。和传统识别方法相比,CNN 可以直接把图像作为输入并且能够自动提取高维特征,从而避免复杂的特征提取和数据重构过程。本文采用经典的CNN 模型作为迁移学习的基础网络。基础 CNN 共拥有 8 层网络结构,包含 5 个卷积层(每一卷积层后面连接一个池化层)、2 个全连接层和一个输出层。卷积层中,前一层计算所得到的特征图与该层的卷积核进行卷积计算。假定,和分别表示输入特征图和
19、输出特征图,则卷积变换为:式中表示卷积核集合(表示第 i 个卷积核)。为了简化,此处省略了偏差项,生成的特征图经过 RELU 激活函数后,进入池化层。在池化层中,每个特征图都在相邻区域上进行下采样。经历总共 5 层的卷积和池化操作之后,特征图将输入全连接层进行最终的分类。在 CNN 网络中,浅层到深层的特征提取是逐步语义信息递增的过程:浅层提取的是通用特征,例如类似于 gabor 特征、局部边缘特征等等;深层提取特异特征,这类特征往往是包含复杂语义信息;而中间层则是二者之间的过渡。根据以上 CNN 网络结构的特性,在对 CNN 进行网络迁移时,可以对通用特征进行迁移,从而保证相关特征可以顺利过
20、渡到特异特征。然而,从相关性较低的数据集进行迁移时,往往会降低被迁移(目标)网络的模型性能。因此,与以往工作选择非医疗数据集作为迁移对象不同,设计从相似眼底疾病数据集中迁移浅层的通用特征,从而保证迁移前后通用特征的一致性。然后设计了新的损失函数,通过青光眼数据集重新训练网络来保证通用特征到特异特征之间的平稳过渡。在二者的共同作用下,设计的网络能够在有限监督信息的情况下,更加准确地挖掘到青光眼的眼底特征。2.3 损失函数 在目标数据集数量有限的情况下,使用相似眼科疾病数据进行特征迁移,可以保证通用特征的一致性。然而,当浅层通用特征过渡到到深层特异特征时,如何平稳过渡是需要考虑的问题。本文使用MM
21、D 损失来减小特异特征之间的差异从而保证特异特征的可迁移性:(3)式中:和表示源数据集和目标数据集;和分别表示其样本数;表示到 RKHS 的映射。最终,确定了最终的损失函数 Loss 如下:式中:为预测标签与其对应的真实标签之间的交叉熵损失函数,是非负正则化参数。本文作为损失函数去预训练分类模型。当网络进行特征迁移时,采用新的函数式(4)来更新模型参数。3 青光眼自动分类实验和结果 训练网络时,采用分步学习的策略设置参数。-4-哈 尔 滨 工 程 大 学 学 报 初始阶段将所有层的学习率设置为 10-2。将所有模型均训练100个轮次。批大小设置为16,动量为0.9。采取 L2 权重衰减进行正则
22、化,将惩罚乘数分别设置为 10-4,丢失率设置为 0.5。对于青光眼检测任务,采用 4 种常用的评估标准来评估分类模型的性能,包括准确性、敏感性、特异性和曲线下面积(area under curve,AUC)。其中准确性(Acc)、敏感性(SE)和特异性(SP)指标定义如下:式中:TP、TN、FP 和 FN 分别是真阳性青光眼、真阴性青光眼、假阳性青光眼和假阴性青光眼的数量。为了充分评估本文提出方法的性能,选择传统方法和深度学习 2 种基准模型进行验证实验。对于传统方法的模型,分别基于高阶谱(higher order spectra,HOS)、离散小波变换(discrete wavelet t
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 深度 迁移 学习 青光眼 自动 分类 中的 应用 赵琳娜
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,个别因单元格分列造成显示页码不一将协商解决,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【自信****多点】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【自信****多点】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。