基于卷积神经网络的乳腺癌病理图像分类.pdf
《基于卷积神经网络的乳腺癌病理图像分类.pdf》由会员分享,可在线阅读,更多相关《基于卷积神经网络的乳腺癌病理图像分类.pdf(12页珍藏版)》请在咨信网上搜索。
1、Modeling and Simulation 建模与仿真建模与仿真,2023,12(5),4320-4331 Published Online September 2023 in Hans.https:/www.hanspub.org/journal/mos https:/doi.org/10.12677/mos.2023.125394 文章引用文章引用:蔡豪杰,王林,王义兵,侍鹏.基于卷积神经网络的乳腺癌病理图像分类J.建模与仿真,2023,12(5):4320-4331.DOI:10.12677/mos.2023.125394 基于卷积神经网络的乳腺癌病理图像分类基于卷积神经网络的乳腺癌
2、病理图像分类 蔡豪杰,王蔡豪杰,王 林林*,王义兵,侍,王义兵,侍 鹏鹏 盐城工学院电气工程学院,江苏 盐城 收稿日期:2023年7月9日;录用日期:2023年8月29日;发布日期:2023年9月5日 摘摘 要要 乳腺癌已经超过肺癌,成为世界第一大癌症。因此,乳腺癌的诊断就显得十分重要。为了提高对乳腺癌乳腺癌已经超过肺癌,成为世界第一大癌症。因此,乳腺癌的诊断就显得十分重要。为了提高对乳腺癌病理图像分类的准确率,提出了一种基于卷积神经网络的诊断方法。这种方法的出现,能做到快速对乳病理图像分类的准确率,提出了一种基于卷积神经网络的诊断方法。这种方法的出现,能做到快速对乳腺癌病理图像进行良恶性分类
3、。一般来说,乳腺癌的病理图像结构十分复杂,为了增强网络的特征提取腺癌病理图像进行良恶性分类。一般来说,乳腺癌的病理图像结构十分复杂,为了增强网络的特征提取的能力,在卷积神经网络的基础上引进随机函数链神经网络和的能力,在卷积神经网络的基础上引进随机函数链神经网络和CA注意力机制。因为乳腺癌数据集太少,注意力机制。因为乳腺癌数据集太少,使用数据增强去扩充数据集。分别进行横向实验与消融实验,实验结果表明,优化后的卷积神经网络能使用数据增强去扩充数据集。分别进行横向实验与消融实验,实验结果表明,优化后的卷积神经网络能有效提高分类的准确率有效提高分类的准确率。关键词关键词 卷积神经网络,随机函数链神经网
4、络,卷积神经网络,随机函数链神经网络,CA注意力机制,数据增强,乳腺癌分类注意力机制,数据增强,乳腺癌分类 Classification of Breast Cancer Pathological Images Based on Convolutional Neural Network Haojie Cai,Lin Wang*,Yibing Wang,Peng Shi School of Electrical Engineering,Yancheng Institute of Technology,Yancheng Jiangsu Received:Jul.9th,2023;accepted:
5、Aug.29th,2023;published:Sep.5th,2023 Abstract Breast cancer has already overtaken lung cancer as the No.1 cancer in the world.Therefore,the diagnosis of breast cancer is of great importance.To improve the accuracy of classifying patholog-ical images of breast cancer,a diagnostic method based on conv
6、olutional neural network(CNN)is *通讯作者。蔡豪杰 等 DOI:10.12677/mos.2023.125394 4321 建模与仿真 proposed.This method makes a quick and automatic benign and malignant diagnosis for breast cancer pathology images.In general,the structure of pathological images of breast cancer is very complex.In order to enhance
7、the capability of feature extraction,Random Vector Functional Link Neural Network(RVFLNN)and Coordinate Attention(CA)are introduced based on CNN.Because there are too few breast cancer datasets,data enhancement is used to augment the datasets.Abla-tion experiments and horizontal experiments were con
8、ducted.The experimental results show that the optimized CNN can improve the accuracy of classification effectively.Keywords Convolutional Neural Network,Random Vector Functional Link Neural Network,Coordinate Attention,Data Enhancement,Breast Cancer Classification Copyright 2023 by author(s)and Hans
9、 Publishers Inc.This work is licensed under the Creative Commons Attribution International License(CC BY 4.0).http:/creativecommons.org/licenses/by/4.0/1.引言引言 随着人工智能的蓬勃发展,其在医学图像领域扮演着越来越重要的角色1 2。目前对乳腺癌的诊断是医学领域的热门研究课题。在医疗工作中,病理图像对于医生的诊断具有重要的辅助作用,医生通过应用人工智能技术对乳腺癌病理图像进行分类,这进一步提高了医生的工作效率。近些年来,计算机人工智能取得了与
10、日俱增的进步,为科研人员在处理病理图像的问题上开辟了新的方向。国内外专家在乳腺癌组织病理学图像分类方面已经取得了一些研究成果。Spanhol 等人3根据82 例乳腺癌病理信息构建了名为 BreakHis 的乳腺癌组织病理学图像数据集,该数据集中包含不同放大倍数的良性与恶性乳腺癌病理切片图像,并且通过提取多个放大倍数乳腺癌病理图像中的切片,训练AlexNet 网络并结合三种融合规则进行分类任务。Han 等人4利用该数据集训练分类器,并利用该分类器区分乳腺肿瘤,采用数据增强的方法,增加模型的训练量,以防止过拟合现象的发生。Cruz-Roa 等人5通过构建一个神经网络,对乳腺癌全视野数字切片进行分类
11、,共使用 400 张人工注释区域标签的切片训练模型,并在 200 张切片上验证其性能,这些切片具有来自癌症基因组图谱的类似注释,乳腺癌分类的水平又提升了一步。Krizhevsky 6提出一种非常出色的深度卷积神经网络 AlexNet 网络,提高了图像的识别率,获得了我们所需要的实验结果。以此为基础,Zisserman 7提出 VGG-Net 的深度卷积神经网络模型,以更小的卷积核和更深的网络层数,进一步提高了分类的精度。随后,Szegedy 8提出了包含Inception 模块的深度卷积神经网络 GoogleNet,在 ImageNet 数据集上测试的错误率更小,结果证实了深度学习在图像识别上
12、具有很大的潜力。人们越来越意识到,以卷积神经网络为代表的深度学习可以很好地解决医学图像中的图像分类等问题。卷积神经网络避免了对图像的复杂前期预处理,可以直接输入原始图像。因此,Byra 等人9开发了一个结合成像技术的模型,从图中直接提取乳腺组织的离散特性,使用卷积神经网络对乳腺癌进行分类,提升了模型的分类效果。一般,在进行乳腺癌分类时,只需要单独考虑它的局部特征和全局特征中的一种,Guo 等人10提出混合 CNN 单元可以充分兼顾图像的局部和全局特征,从而做出更准确的预测。为了提高分类器的性能,他还提出了装袋策略和分层投票策略,这两种策略在乳腺癌分类中都获得了 87.5%的准确率。为了突出乳腺
13、癌图像的特征,Das 等人11提出了 CNN 的多实例学习框架,并引入了一个新的池化层。它从整个幻灯片中捕获信息量最大的特征,而不必在补丁之间重叠,最终分类准确率达到 88%。Open AccessOpen Access蔡豪杰 等 DOI:10.12677/mos.2023.125394 4322 建模与仿真 Akba 等人12提出了一种新的 CNN 正则化技术,并将其命名为转换模块。该模块以多种不同的方式捕获过滤器,并应用全局平均池化来简化从卷积层到全连接层的网络结构,最终实现了 91.9%的分类精度。SIMONYAN 13在论文中提出了 VGG。VGG 14 15 16 17的出现表明,小
14、型卷积网络可以通过增加深度来提高网络的性能。CNN 构建的图像处理系统可以有效减少过拟合,He 18等人提出了 ResNet,并开创了一种新的网络结构,称为残差单元。Huang 19等人提出了一种基于密集块的 DenseNet,进一步提高了网络性能。此外,Szegedy 20等人提出了 Inception-ResNet-v1 和 Inception-ResNet-v2。这两个模型是通过将初始与残差单位相结合生成的。它们提高了培训效率和分类的准确性。由此可见,卷积神经网络的出现为医疗领域做出了巨大的贡献,所以本文在卷积神经网络的基础上增加随机向量函数链神经网络和 CA 注意力机制来加快模型训练的
15、速度,增加模型的特征,从而提升模型的分类效率。全文的组织分配如下:第二章介绍了随机向量函数链神经网络,卷积神经网络和 CA 注意力机制,分析了它们的原理。第三章分别进行横向与纵向实验,将实验结果和本文所提出的模型实验结果进行对比。第四章得出实验结果,提出新想法。本文做出以下贡献:1)随机向量函数链神经网络 RVFLNN 模型和 CA 注意力机制具有简洁性、特征提取能力强以及高准确性的特点,提出了 RVFLNN-CNN-CA 的分类模型。2)公开乳腺癌数据集的数量少,采用数据增强对原来的数据集进行扩充。3)进行横向和纵向实验,证明 RVFLNN-CNN-CA 的分类模型分类精度更高。2.方法方法
16、 2.1.RVFLNN 深度结构所产生的力量十分强大,可是几乎所有该结构的网络都含有很多的参数量,它的训练过程会很复杂。所以为了提高网络训练的准确度和效率,我们基本会采用提高网络的深度和调整参数这两种方法,随机向量函数链神经网络(Random Vector Functional Link Neural Network,RVFLNN)的出现解决了这个问题。在学习宽度学习的时候,发现了这个神经网络,RVFLNN 实际上是宽度学习的左半部分。它的结构图如图 1。Figure 1.RVFLNN 图图 1.RVFLNN 蔡豪杰 等 DOI:10.12677/mos.2023.125394 4323 建模
17、与仿真 确定一共有 K 个样本数据()(1),KiiiDX Y=,其中12,iiiiMXxxx=是 M 维输入向量,12,NYy yy=为 N 维输出向量。第 i 个输入向量经过输入层附着随机权重后,其第 j 个隐含层节点的值为:1,1,2,Mjmjimijmhgw xbiK=+=结合输入层与隐含层节点的输出,RVFLNN 中输出层节点的值可表示为:()11,1,2,LL Mijjijijii LzhXxiK+=+=+=()L MNR+是隐含节点的输出权重矩阵,L 为隐含层数,()jihx是第 j 个隐含层节点的输出值,ijx是第 i 个输入向量的第 j 个特征,iz是第 i 个输出层节点的值
18、。矩阵表示为:HY=在 RVFLNN 中,权重和偏差 b 在学习过程中是被随机设置的,而权重 是通过学习确定的。使用均方误差作为目标函数,输出权重矩阵可以根据网络输出误差 E 对进行建模:H Y+=H+被定义为广义逆,利用正交投影,在对角线添加一个小的正值,以防止 产生奇点。2.2.CNN 一般来说,CNN 主要由输入层、卷积层、池化层和全连接层和输出层组成。CNN 的结构图如图 2所示。输入层主要是用来载入图像,本文的输入图像就是经过数据增强后的乳腺癌数据集。卷积层主要用来提取图像的特征,在每个卷积层中都用到 Relu 激活函数。池化层又称下采样层,一般放在连续的卷积层之间,用于压缩数据和参
19、数。池化层的作用主要有两个,一是特征不变性,二是特征降维。常见的池化方式有最大池化和平均池化,本文用的是最大池化。Figure 2.CNN 图图 2.CNN 2.3.CA 注意力机制类似于人类的视觉注意力机制,利用有限的注意力资源从繁复的信息中快速筛选出有价值的信息,帮助模型训练以更好地完成任务。因此,本文引入了可以同时获取通道信息和方位信息的 CA注意力机制(Coordinate Attention)。CA 注意力机制的操作主要分为两步,第一步是坐标信息的嵌入。在输入维度为 C H W 的特征图蔡豪杰 等 DOI:10.12677/mos.2023.125394 4324 建模与仿真 之后,
20、分别利用尺寸为(H,1)和(1,W)的平均池化从水平 X 方向和垂直 Y 方向对通道进行编码,得到高度为 h 的第 c 个通道和宽度为 w 的第 c 个通道的输出,如下式所示:()()01,hcci Wzhxh iW=()()01,wcci Hzwxj wH=第二步是坐标信息特征图生成,将上面两个输出沿两个方向的聚合特征hz和wz沿空间维度串联,然后进行卷积核大小为 1 1 的卷积运算,最后通过非线性激活函数,得到包含水平和垂直方向空间信息的中间特征图 f,如公式(3):()()1,hwfFzz=然后沿空间维度分解 f 为两个张量hf和wf,分别沿水平和垂直方向进行卷积和激活函数的处理,公式如
21、下:()()hhhgFf=()()wwwgFf=最后将两个方向的输出结果作为注意力权重扩展,最终得到如下输出:()()()(),hwccccyi jxi jgigj=2.4.提出的新模型提出的新模型 RVFLNN-CNN-CA 为了提高乳腺癌分类的准确率,本文提出了一种基于 RVFLNN-CNN-CA 的新模型。这里面的卷积神经网络有六个卷积层,五个池化层,一个全连接层组成。选择卷积神经网络作为基础网络是因为它具有良好的分类性能,网络结构也非常完整,适合对网络进行进一步优化。构建 RVFLNN-CNN-CA 模型算法的主要过程如下:Figure 3.The flowchart of RVFLN
22、N-CNN-CA 图图 3.RVFLNN-CNN-CA 的流程图 蔡豪杰 等 DOI:10.12677/mos.2023.125394 4325 建模与仿真 1)进行随机连接。将原始的数据集进行数据增强,使用 RVFLNN 算法进行训练,来提升模型的训练效率,增加数据的特征属性。2)将 RVFLNN 算法训练的结果放入 CNN。在训练 CNN 之前,我们首先保存 RVFLNN 的结果,然后将它们放入一个新文件夹中,这是 CNN 的输入。3)将 CA 添加到 CNN。对于添加注意力模块的模型的哪一部分可以提高网络性能,没有固定的陈述。因此,我们可以尝试将 CA 添加到不同的位置以比较实验效果。从
23、后面的实验中,我们可以看到,通过在激活函数的后面加入注意力机制,可以获得最高的分类精度。RVFLNN-CNN-CA 模型的工作流程如图 3 所示。3.实验实验 3.1.数据的获取和增强数据的获取和增强 乳腺组织病理学图像数据集来源于 Kaggle,由 Janowczyk 等人创建。该数据集包含乳腺癌细胞和正常细胞两大类。部分数据如图 4 所示。Figure 4.Some data sets are presented 图图 4.部分数据集展示 尽管原始数据集包含 162 张图像,但对于神经网络来说还远远不够。因此,我们需要使用数据增强技术来扩充数据集。数据增强具有许多优点,它不仅在一定程度上解
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 基于 卷积 神经网络 乳腺癌 病理 图像 分类
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【自信****多点】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【自信****多点】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。