基于DeeplabV3 网络的睑板腺图像分割研究和评价.pdf
《基于DeeplabV3 网络的睑板腺图像分割研究和评价.pdf》由会员分享,可在线阅读,更多相关《基于DeeplabV3 网络的睑板腺图像分割研究和评价.pdf(6页珍藏版)》请在咨信网上搜索。
1、18 China Digital Medicine.2023,Vol.18,No.8基于 DeeplabV3+网络的睑板腺图像分割研究和评价杨伊 张洪 单琨 刘瑶 赵文兵 蔡越江 洪佳旭 赵地【摘要】目的:构建基于 DeeplabV3+网络的人工智能(AI)系统算法模型,提高眼干燥症诊疗效率。方法:收集某医院干眼门诊就诊患者的睑板腺图像,构建图像数据库,随机分配为训练集和验证集,投入模型训练,分析并验证其可行性和有效性。结果:在内部验证集,基于 DeeplabV3+的算法模型对于睑板腺区域分割的准确率达 95.65%,均交并比和 Kappa 系数分别为 83.75%和 92.96%。该算法分割
2、出的萎缩区域,与临床医生分割结果相似。结论:DeeplabV3+网络模型能够实现眼干燥症患者睑板腺腺体的自动切分,可辅助相关疾病的临床诊断和筛查,提高诊断效率。【关键词】机器学习;语义分割;眼干燥症;睑板腺萎缩Doi:10.3969/j.issn.1673-7571.2023.08.004【中图分类号】R770.4;R319 Research and evaluation of tarsal gland image segmentation based on DeeplabV3+networkYANG Yi,ZHANG Hong,SHAN Kun,LIU Yao,ZHAO Wenbing,CA
3、I Yuejiang,HONG Jiaxu,ZHAO Di.School of Computer Science,Beijing University of Technology,Beijing 100124,China(YANG Yi,ZHAO Wenbing,CAI Yuejiang);Eye and ENT Hospital of Fudan University(ZHANG Hong,SHAN Kun,HONG Jiaxu);Institute of Computing Technology,Chinese Academy of Sciences(LIU Yao,ZHAO Di)Cor
4、responding authors:ZHAO Wenbing,Email: HONG Jiaxu,Email:jiaxu.hongfdeent.org ZHAO Di,Email:【Abstract】Objective To construct an artificial intelligence(AI)system algorithm model based on DeeplabV3+network to improve the efficiency of ophthalmoxerosis diagnosis and treatment.Methods The tarsal gland i
5、mages of ophthalmoxerosis patients in a hospital were collected and the image database was constructed.The images were randomly divided into a training set and a validation set,and the model trained to analyze and verify its feasibility and effectiveness.Results For the internal validation set,the a
6、ccuracy of the algorithm model based on DeeplabV3+for tarsal gland region segmentation reached 95.65%,with the mIOU and Kappa coefficient of 83.75%and 92.96%,respectively.The atrophic regions segmented by this algorithm were similar to those segmented by clinical doctors.Conclusion The DeeplabV3+net
7、work model can achieve automatic segmentation of tarsal gland,which can assist clinical diagnosis and screening of related diseases and improve diagnostic efficiency.【Keywords】Machine learning;Semantic segmentation;Ophthalmoxerosis;Tarsal gland atrophy作者单位:100124 北京,北京工业大学计算机学院(杨伊、赵文兵、蔡越江);复旦大学附属眼耳鼻
8、喉科医院(张洪、单琨、洪佳旭);中国科学院计算技术研究所(刘瑶、赵地)通信作者:赵文兵,Email: 洪佳旭,Email:jiaxu.hongfdeent.org 赵地,Email:专题策划人工智能在医药领域的应用Special Planning中国数字医学2023 第 18 卷 第 8 期 19眼干燥症是指由泪液的量或质或流体动力学异常引起的泪膜不稳定和眼表损害,从而导致眼部不适症状及视功能障碍的一类疾病,多发于老年人群体,但随着电脑、手机、平板等电子设备的高频率使用,其发病也逐渐呈现年轻化趋势1。全球眼干燥症发病率为 5.5%33.7%;我国眼干燥症患病人数居世界首位,患病率达21%30%
9、,眼干燥症患者占眼科门诊患者的 30%以上2。眼干燥症检测过程复杂,亟需更加便捷的诊断方式,临床中由睑板腺功能障碍引起者占 50%以上,因此睑板腺的形态变化对于其诊断尤为重要。机器学习技术在眼干燥症检测领域的研究与应用中已取得了一定进展,本研究通过图像预处理、图像增强、睑板区域分割、睑板腺的面积缺失率计算及等级判定,实现睑板腺萎缩状况的自动诊断,避免手动分析图片的时间消耗及人为因素的干扰,提高眼干燥症诊断的客观性。1 方法1.1 图像处理1.1.1 数据集标注 选取就诊于复旦大学附属眼耳鼻喉科医院干眼中心的眼干燥症患者,应用眼表综合分析仪 OCULUS Keratograph 5M 采集 红外
10、睑板图像,剔除过于模糊、拍摄范围不全面、有睫毛遮挡、存在大面积过强反光的睑板腺图像后,最终纳入 90 幅较清晰的图像作为本次研究的数据集,训练集和验证集比例设置为 0.8:0.2。每幅图像均使用 Labelme 软件中的多边形工具标记睑板腺腺体存在区域和缺失区域。完成标注后保存文件,软件生成的语义分割标签图为 json 格式。将 json 格式的标签图转换成与标注图像尺寸相同的 png 标签图。其中,_background_ 不在本文的语义分割类别中,该类别是未标注的区域对应的标签,语义分割网络不会对 _background_ 标签对应的类别进行训练。最终,形成原始图像、伪彩色标注图及彩色可视
11、化结果。见图 1。1.1.2 数据集增强由于原始训练图片数据集只有90 幅图像,不足以训练神经网络,本研究选取数据增强模块中调整步 长 缩 放(resize step scaling)、随 机 填 充 裁 剪(random padding crop)、随 机 水 平 翻 转(random horizontal flip)、随机失真(random distort)和归一化(normalize)5 种 配置选项以增加数据样本的多样性。调整步长缩放操作将尺寸调整的最小比例(min_scale_factor)设置为 0.5,最大比例(max_scale_factor)设置为2.0,步长设置为0.25,
12、用于控制每次调整的幅度,提供精细的尺寸调整,增加数据增强的计算复杂度。随机填充裁剪操作填充的位置可以选择在图像的上、下、左、右或任意组合位置,裁剪的尺寸(crop_size)设置为 1024,512。随机水平翻转操作是基于概率图 1 标注结果(c)彩色可视化结果(a)原始图像(b)伪彩色标注图专题策划人工智能在医药领域的应用Special Planning20 China Digital Medicine.2023,Vol.18,No.8执行图片的水平翻转。本研究将水平翻转的概率设置为 0.5,对于每张图像,随机生成一个 0 1 的随机数。如果生成的随机数小于水平翻转的概率,那么执行水平翻转操
13、作;如果大于概率,则保持图像不变。随机失真操作通过随机应用一系列图像扭曲操作改变图像的外观和特征。本研究将亮度、饱和度和对比度调整因子设置为 0.4。进行归一化处理时首先计算图像数据集的均值和标准差。对于每个像素位置上的像素值,执行以下操作减去均值并除以标准差,使得图像每个像素位置上的值都被缩放到合适的范围,从而消除奇异样本数据导致的不良影响。1.2 模型构建1.2.1 DeeplabV3+整体结构 见 图 2。DeeplabV3+3在 编 码 器(encoder)中的具体过程如下。首先,利用并行的空洞卷积从压缩 4 次后的初步有效特征层得到特征层,然后分别以不同的膨胀率进行特征提取,其中卷积
14、采用膨胀率分别为 6、12、18 的 33 卷积,在不损失信息的情况下提高网络的感受野,使每个卷积输出都包含较大范围的信息,网络有不同的特征感受情况,特征提取后再进行合并,最后进行11 卷积压缩特征,获得绿色特征层。解码器(decoder)的主要过程是对深度卷积神经网络(deep convolutional neural network,DCNN)生成的压缩两次的较浅的特征层经过 11 卷积,得到的结果与由编码器生成的具有高语义信息的特征层(encoder 输出)进入Decoder 中进行上采样后的结果进行堆叠,完成堆叠后,以 33 卷积提取特征,这时获得一个最终的有效特征层,是整张图片的特征
15、浓缩。最后进行上采样使得最终输出图片的大小和输入图片一样,得到预测结果。1.2.2 特征提取网络 ResNet 网络4的核心思想是在神经网络中增加跨层连接(skip connection),使得模型的深度更加容易训练。在传统的神经网络中,网络的每一层都会对输入数据做出一些变换,这些变换可能对后续层的学习产生负面影响,尤其是在网络深度加深时。而 ResNet 提出的跨层连接可以将输入直接跳过一些层之后与输出相加,保留浅层特征,从而解决梯度消失和过拟合问题。本研究采用ResNet50-D 结构,即拥有 50 个卷积层的 ResNet-D 网络,结构见图 3。ResNet50-D 分 为 5 个 阶
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 基于DeeplabV3 网络的睑板腺图像分割研究和评价 基于 DeeplabV3 网络 睑板腺 图像 分割 研究 评价
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【自信****多点】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【自信****多点】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。