分销赏收藏举报申诉 / 10

立即下载开通VIP

当前位置：首页 > 学术论文 > 毕业论文/毕业设计 > 基于改进MobileViT...的大球盖菇品质分级实验研究_左银华.pdf

基于改进MobileViT...的大球盖菇品质分级实验研究_左银华.pdf

上传人：自信****多点

文档编号：2349513

上传时间：2024-05-28

格式：PDF

页数：10

大小：1.99MB

《基于改进MobileViT...的大球盖菇品质分级实验研究_左银华.pdf》由会员分享，可在线阅读，更多相关《基于改进MobileViT...的大球盖菇品质分级实验研究_左银华.pdf（10页珍藏版）》请在咨信网上搜索。

1、实验技术与管理第 40 卷第 9 期 2023 年 9 月 Experimental Technology and Management Vol.40 No.9 Sep.2023 收稿日期:2023-04-27 基金项目:浙江省基础公益研究计划项目（LGN22E050003）；浙江省新苗人才计划项目（2022R409A037）作者简介:左银华（1997），女，甘肃庆阳，硕士研究生，主要研究方向为机器视觉与图像处理，。通信作者:赵明岩（1974），男，山西侯马，硕士，副教授，主要研究方向为现代农业装备及农业机器人，。引文格式:左银华，赵明岩，吴顺海，等.基于改进 MobileV

2、iT 模型的大球盖菇品质分级实验研究J.实验技术与管理,2023,40(9):81-90.Cite this article:ZUO Y H,ZHAO M Y,WU S H,et al.Experimental study on quality grading of stropharia rugoso-annulata based on improved mobileViT modelJ.Experimental Technology and Management,2023,40(9):81-90.(in Chinese)ISSN 1002-4956 CN11-2034/T DOI:10.16

3、791/ki.sjg.2023.09.012 基于改进 MobileViT 模型的大球盖菇品质分级实验研究左银华，赵明岩，吴顺海，李一欣（中国计量大学机电工程学院，浙江杭州 310018）摘要：针对传统大球盖菇人工分级劳动强度大、效率低、一致性差等问题，提出基于 MobileViT 模型的改进方法。通过设计自适应分支的多尺度模块、增加局部与全局特征融合、引入双重注意力模块等，提高特征提取能力，增强模型鲁棒性。实验结果表明，改进后的 XCA-MobileViT 对实验平台上 5 个级别的大球盖菇数据集平均识别准确率达 97.71%，相较于 MobileViT 模型准确率提高 2.34%

4、，参数量和计算量分别下降 0.401 M和 140.2 M。通过对两个菌菇公开数据集进行的验证实验发现，XCA-MobileViT 的 F1 分及准确率超越对比的其他模型，具有良好的泛化性。关键词：深度学习；多尺度特征；双重注意力；大球盖菇；MobileViT 中图分类号：TP391 文献标识码：A 文章编号：1002-4956(2023)09-0081-10 Experimental study on quality grading of stropharia rugoso-annulata based on improved MobileViT model ZUO Yinhua,ZHAO

5、Mingyan,WU Shunhai,LI Yixin(School of Mechanical and Electrical Engineering,China Jiliang University,Hangzhou 310018,China)Abstract:Aiming at the problems of traditional manual grading of stropharia rugoso-annulata,such as high labor intensity,low efficiency,and poor consistency,an improved method b

6、ased on MobileViT model was proposed.By designing multi-scale modules with adaptive branching,adding local and global feature fusion,and introducing dual attention modules,the feature extraction capability is improved and the model robustness is enhanced.The experimental results show that the averag

7、e recognition accuracy of the improved XCA-MobileViT for the five levels of stropharia rugoso-annulata datasets on the experimental platform is 97.71%,which is 2.34%higher than that of the MobileViT model,and the number of parameters and computation decreased by 0.401 M and 140.2 M respectively.Thro

8、ugh validation experiments on two publicly available datasets of mushrooms,it was found that the F1 score and accuracy of XCA-MobileViT exceeded other models compared and showed good generalization.Key words:deep learning;multi-scale feature;dual attention;stropharia rugoso-annulata;MobileViT 大球盖菇色泽

9、鲜艳，菌柄粗大，富含矿物质、维生素等生物活性物质及人体必需的氨基酸1，分级销售可获得更好的经济效益2。目前大球盖菇分级主要依靠人工进行，存在劳动强度大、效率低、一致性差等问题，严重制约了相关产业规模化、标准化发展。近年来，针对菌菇分级问题，国内外研究人员在利用光谱分析技术3-5和视觉图像机器学习方法6-8方面开展了大量研究并取得了一定进展，但仍存在检测范围小、信息获取量少、成本高、耗时长和特征提取难度较大等问题。随着大数据技术的发展及计算机算82 实验技术与管理力的大幅提升，深度学习技术在农业信息领域的应用取得了丰硕成果9。在菌菇分级方面，Liu Q10等提出一种高效通道修剪机制

10、改进 YOLOX 深度学习方法，可有效检测香菇表面纹理，mAP（平均精度均值）和FSP（每秒帧率）分别为 99.96%和 57.38。Wu Y11等将 YOLOv5 单阶段目标检测和 PSPNet 的语义分割深度集成，提出一种用于实时目标检测的 Y-PNet 模型和图像分割网络，使用 MobileNetV3 嵌入式 CBAM 来改进 PSPNet，将像素精度提高到 96.35%。尽管卷积神经网络（convolutional neural networks，CNN）功能强大，但菌菇级别评判标准（包括菌体发育水平、菌盖内卷水平、有无开伞迹象、子实体长度和菌盖直径等）繁杂，CNN 难以建模和提取全局

11、级别特征。Vision Transformer（ViT）12克服了 CNN 的局限性，将图片分割成多个补丁，通过嵌入补丁将图片压缩成一定维度的向量，并加入位置信息，输送至transformer 编码器。Wang B13提出一种新的深度学习架构，使用视觉 ViT 大型网络进行蘑菇分类，在测试数据集上获得了 95.97%的准确率。Liu Z 提出包含滑动窗口操作、具有层级设计的 Swin Transformer14，克服了以往 transformer基于全局计算注意力计算复杂度高的缺点，引入滑动窗口，增加了局部性。但对比轻量级 CNN，如 MobileNet15和 ShuffleNet16，用于视

12、觉领域的 transformer 虽然提高了准确率，但存在模型参数大、计算量大等问题，不满足菌菇检测对速度、精度的要求。考虑到 CNN 和 ViT 模型的特性，我们设计了基于 MobileViT17针对大球盖菇分级检测任务的混合模型与相关实验，即 XCA-MobileViT，该模型具有快速、准确、轻量化等特点，可为食用菌品质分级和有毒蘑菇鉴别提供技术支持。1 数据集 1.1 实验样本实验选用杭州市富阳区、金华市武义县、湖州市德清县种植基地的大球盖菇。参考大球盖菇鲜品等级划分标准，以菌柄形态、鲜重作为主要指标，结合子实体长度、菌柄直径和菌盖直径可将大球盖茹分为 A级、a 级、B 级、b 级和

13、S 级 5 个鲜品等级2。本文将大球盖菇划分为 5 类：一等品、二等品、三等品、菌菇柄、菌菇伞，具体参数如表 1 所示。1.2 数据集图像采集及预处理采集系统由摄像头模块和光源模块组成，色温范围为 3 0006 500 K。不同级别的大球盖菇平放在聚氯乙烯（polyvinyl chloride，PVC）绿色传送带上，用通用串行总线（universal serial bus，USB）接口的HIKVISION 表 1 大球盖菇鲜品等级分级鲜品等级指标一等品二等品三等品菌柄菌伞鲜重/g 38.620.838.6 12.620.8/子实体长度/cm 7.010.56.08.5 5.08

14、.3/菌柄直径/cm 2.44.01.92.7 1.62.4 1.64.0/菌伞直径/cm 4.16.33.24.5 2.74.0/2.76.3形态彩色工业相机（相机型号为 MV-CE060-10UC，镜头型号为 MVL-HF0628M-6MP）垂直采集大球盖菇样本，拍摄距离为 15 cm，样本总数为 3 100 幅，每幅图像像素大小为 2 0482 048，格式为联合图像专家组（joint photographic experts group，JPEG）。图像采集装置如图 1 所示。图 1 大球盖菇数据集样本采集装置为了应对数据集样本数量过少而可能导致的过拟合问题，同时提高模型泛化能力和

15、识别准确率，采用数据增强方法对样本图像数量进行扩充。使用OpenCV 对图像进行水平翻转、垂直翻转、随机旋转、亮度变换以及对比度变换等操作。最终获得 8 752 幅图像数据集，包括所有增强后的图像样本，其中，一等品 1 104 幅，二等品 1 488 幅，三等品 1 336 幅，菌柄 2 616 幅，菌伞 2 208 幅。模型训练时，从样本集中随机选取 60%的样本作为训练集，训练模型参数及调整模型超参数，剩余 40%作为测试集评估模型。利用TensorBoard 可视化工具跟踪模型指标，检查深度学习工作流程中的权重和偏差，判断模型是否发生过拟合，进行超参数优

16、选和模型择优。2 搭建 XCA-MobileViT 网络模型 ViT 被广泛应用于视觉处理18，通过自注意力（self-attention）机制学习全局表示，基于 transformer的模块在很大程度上依赖于自注意力操作，增加了计左银华，等：基于改进 MobileViT 模型的大球盖菇品质分级实验研究 83 算的二次复杂度。本文基于 MobileViT 提出一种用于大球盖菇的快速分级检测轻量级混合模型，通过转置query 和 key 的注意力特征映射来降低 transformer 的计算成本，结合以更细粒度表达多尺度特征的深度可分离卷积表征局部特征，最后将输入特征图在通道维度上进行随机重组

17、，从而增加模型的非线性表示能力，实现轻量、高准确度的 CNN-ViT 混合模型XCA-MobileViT。2.1 XCA-MobileViT 网络结构 XCA-MobileViT 结构如图 2 所示。输入特征经过33 的标准卷积层进入连续堆叠数量为 2 的 MV2 模块后，采用卷积核为（2，2）的卷积层来实现下采样，减少池化层（pooling layer）所需的参数量。下采样过程中存在一个信息损失，而池化层不可学习，用步距为 2 的可学习的卷积层来代替池化层可得到更好的效果。特征图经过第 2 个下采样层后进入改进的MobileViT 模块，其中全局特征表达的交叉斜方差注意力（cross-cov

18、ariance attention，XCA）模块堆叠 2次。重复不同设置的 MV2 模块和改进的 MobileViT模块，特征进入 11 的标准卷积进行升维，依次经过Shuffle Attention（SA）双通道注意力19映射和池化层，最后全连接层（fully connected layers，FC）将特征表示映射到样本的标记空间。图 2 XCA-MobileViT 混合模型架构 2.2 改进的 MobileViT 模块改进的 MobileViT 模块结构如图 2 所示，以 33深度卷积（depth-wise convolution）替代原有的 33普通标准卷积，对每个通道应用单独的滤波器

19、，减少模型所需的参数数量，加快模型的训练速度。输入特征经过 11 卷积层进行特征升维的同时，增加了模型的非线性。在原有 MobileViT 基础上，为获得具有更灵活和自适应空间感受野的输出特征，参考 Res2Net的架构设计，增加了自适应分支模块，以更细粒度表达多尺度特征，降低参数计算量，增加每个网络层的感受野（receptive fields）范围，增加局部融合。首先将输入特征 HWC 通过直接的通道切分为 s 个子集（图中 s=4），每个子集尺寸均为 HWC/4，每个子集都是将上一个子集的输出特征融合后再经过 33的深度卷积进行特征编码，最后在通道维度上拼接 s个子集的输出特征，得到具有多

20、尺度感受野的输出特征 HWC。切分通道数 s 的值在三次堆叠中是自适应的，s3,4,5。图 3(a)显示了多尺度分支结构的细节，将特征映射分成 s 个子集，每个子集用 Xi表示，每个子集都有一个对应的 33 深度可分离卷积，用 Zi表示，输出为 Yi，特征子集 Xi与 Zi-1的输出相加，然后输入 Zi()，所得的 Yi可以被写成：-1 =1=()=2(+)2 iiiiiiiiiis|XYZXZXY（1）在标准的Transformer模块中，传统自注意力以更高的浮点运算数（floating point operations，FLOPs）和延迟为代价，在全局特征表达中使用key和query之间的

21、交叉斜方差矩阵，以消除传统自注意力在时间和内存方面的二次复杂性。如图3(b)所示，将输入特征HWC尺寸修改为HWC，通过3个线性层得到Q（query）、K（key）和V（value），在计算交叉斜方差注意力之前，对Q、K应用L2范数平滑权重参数，提高模型的稳定性。不同于以往Q、V之间在空间维度计算KT和Q运算得到（HWHW），在通道维度上计算注意力，对Q进行转置得到QT，因此（CHW）（HWC）可得到（CC），经过Softmax函数得到注意力得分矩阵，与匹配对应的V相乘，将其相加得到最终的注 84 实验技术与管理图 3 自适应分支结构和 XCA 模块意力图。最后，依次通过线性层

22、、归一化层以及HardSwish函数激活来生成非线性特征。使用上述对Q、K和V的定义，将交叉协方差注意力函数定义为：TT-Attention(,)(,)=Q K VVK Q（2）TT(,)Softmax(/)=K QK Q（3）其中，每个输出token的输入维度是其在V中对应的token输入的dv特征的凸组合；注意力权重是基于交叉斜方差矩阵计算的。2.3 Shuffle Attention 注意力机制能使神经网络准确地关注输入的所有相关元素。计算机视觉研究中广泛使用的注意力机制主要有空间注意和通道注意两种，分别用于捕捉像素级的成对关系和通道依赖。将两者结合在一起会获得更好的性能，但会增加计算开

23、销。采用SA注意力模块，通过Shuffle 单元可有效结合两种类型的注意力机制，同时可有效减少计算开销。SA模块将通道尺寸分解为多个子特征，对每个子特征利用一个“shuffle”单元来描述空间与通道维度的特征依赖关系，再对它们进行并行处理，最后对所有子特征进行聚合。SA原理如图4所示。对给定的输入特征C H WRX，SA在通道维度将X分为N组1,N=XXX，kC/N H WRX,每个注意力单元NX沿通道维度分成两个分支1,kX 2/2kCN H WRX。在通道注意力分支，首先通过使用全局平均池化（golbal average pooling，GAP）来嵌入全局信息，以生成21 1C/Np R

24、的通道统计，该统计可以通过将Xk1缩小到空间维度HW来计算：gp11111()(,)H WkkijpFi jHW=XX（4）式中，Fgp表示对特征Xk1进行全局平均池化。通道注意力的最终输出为：1c1111()()kkk Fpp=+XXZaX（5）其中，Fc表示将特征进行缩放，12C/N H WRZ和1C/N H WRa是缩放和转换p的参数。图 4 SA 模块结构图左银华，等：基于改进 MobileViT 模型的大球盖菇品质分级实验研究 85 在空间注意力分支，使用组归一化（group normalization，GN）获得空间统计，采用c()F 增强对2kX的表达，

25、空间注意力通过式（6）获得：22222()(kkkGN=+XZXaX（6）其中Z2和a2是尺寸为2C/N H WR的参数。最后，采用“channel shuffle”算子来实现沿信道维度的跨组信息流，聚合所有子特征。在单个SA模块中，每个分支的通道数为C/2N，总参数量为3C/N（N为32），因此SA是非常轻量级的，通过在池化层之前引入SA模块，在增加较小计算量的条件下进一步提高了特征提取能力。3 实验 3.1 实验环境配置与网络参数设置实验采用Windows 10平台进行测试及训练，计算机硬件配置包括：中央处理器为Intel（R）Core（TM）i7-9700F CPU3.00 GHz，运

26、行内存为16 GB，图形处理器为14 GB NVIDIA GeForce RTX 2060，使用pytorch1.7.1深度学习框架，程序中调用CUDA等第三方深度学习库加速训练模型。学习率采用余弦退火（cosine annealing）衰减策略20。curminmaxmin1()1cos2iiiiTtT=+-+|（7）其中，i为索引值，min和max分别表示学习率的最小值和最大值，curT为当前执行的轮次，iT为第i次运行中总的迭代轮次。实验设置：min0.001=，max0.01=，训练总迭代次数为150，批量大小为4。在训练期间保存在验证集上表现最佳的模型。损失函数描述了模型相对预期结果

27、的执行效率，由于大球盖菇样本存在类别不平衡问题，在训练检测模型时会遇到困难，使用Polyloss框架21中的Poly-1，将交叉熵损失函数分解为一系列加权多项式基，仅需用一个额外的超参数简单地调整主导多项式系数，缓解了类别不平衡问题，进一步提升了大球盖菇检测准确率。Poly-1修改了交叉熵损失函数多项式系数：CE12lg()1/(1)(1)1/2(1).jttjttLPjPPP=-=-=-+-（8）2Poly-111(1)(1)1/2(1)lg()(1)ttttLPPPP=+-+-+=-+-（9）其中，tP是目标实际水平的算法预测概率，1R+是多项式系数。使用Poly-1可将精度提高0.952

28、%。为进一步提升网络训练效果，同时不改变整个数据集的分布，采用CutMix的数据增强22方式，对两张图片进行硬融合，同时采取标签软融合策略。在训练图像之间剪切和粘贴补丁，同时将该矩形区域的标签与原图像的标签按照面积占比进行加权平均，生成新的标签。通过有效使用训练像素和保留面积损失来实现正则化效果。CutMix的具体实施流程如下：ABAB(-)(1-)xxxyyy=+=+K1 K?（10）其中，K 表示二进制矩形掩码，指从两个样本中裁剪和填充的位置，1 是用1填充的二进制掩码，表示元素乘积，混合比(0,1)U，下角标A、B分别代表A图和B图。为得到掩码 K，通过式（11）确定CutMix边框的坐

29、标(,)xywhr r rr：Unif(0,),1Unif(0,),1xwyhrWrWrHrH=-|=-|（11）其中，W为图像宽度，H为图像高度。式（11）确定了补丁与原图的面积比，即图像切口的面积越大，融合标签时的比例越小。在训练中采取的是在线增强，实验结果表明，采取离线CutMix数据增强后准确率可进一步提高0.768%。3.2 XCA-MobileViT 的结果及定量分析为验证XCA-MobileViT模型的性能，对测试集3 499幅大球盖菇图像进行测试评价，实验结果如表2所示。XCA-MobileViT对大球盖菇等级的平均分类识别准确率较高，为97.7%，分类性能由高到低依次为菌柄

30、、菌伞、一级菇、三级菇和二级菇。由于大球盖菇极易破损、形态各异、特征区分不明显，二等品和三等品的大球盖菇特征差异较小，极易发生误判。而XCA-MobileViT模型可通过层次级联实现多尺度感受野的融合，从而实现不同等级大球盖菇的准确检测。模型在自注意力计算部分，通过将点积运算应用于通道维度，得到了兼具计算复杂度与全局注意力的输出，SA进一步关注不同特征的显著差异，更轻量化的特点使得模型更适合部署于移动设备上。对在自然状态下采集的大球盖菇的等级进行分级和检测，并选择精确率（precision）、召回率（recall）、特异度（specificity）和F1分作为评估指标。具体计算公式如下：Pre

31、cisionTP(TPFP)=+（12）RecallTP(TPFN)=+（13）SpecificityTN(TNFP)=+（14）F12 PrecisionRecall(PrecisionRecall)=+（15）式中，TP为被模型预测为正类的正样本，FP为被模型预测为正类的负样本，FN为被模型预测为负类的正样本。86 实验技术与管理表 2 XCA-MobileViT 模型检测大球盖菇等级参数统计大球盖菇等级测试集 TP FP FN 精确率召回率特异度 F1 分平均准确率一等品 441 431 26 10 0.943 0.977 0.991 0.960 二等品 595

32、543 26 52 0.954 0.913 0.991 0.933 三等品 534 518 27 16 0.950 0.970 0.991 0.960 菌伞 883 882 0 1 1.000 0.999 1.000 0.999 菌柄 1 046 1 045 1 1 0.999 0.999 1.000 0.999 0.977 实验结果显示，菌伞和菌柄的F1得分和准确率远高于其他类别，这是因为第一类、第二类和第三类蘑菇的形态相似、特征区别较小，尽管如此，该模型依然表现出良好的分类性能，拥有较高的分类准确率。3.3 混淆实验混淆矩阵主要用于比较分类结果与实际预测值的差异，是一种直观的可视化工具。

33、混淆矩阵每一行代表了预测类别，每一行的总数表示预测属于该类别的样本数量。每一列代表了样本的真实归属类别，每一列的数据总数表示该类别样本的真实数目。对角线的数据代表样本预测值与真实值一致，对角线数据越多，模型预测效果越好。如图5所示，原始MobileViT模型对相邻等级菌菇检测能力较差，例如将二等品的17.98%检测为一等品或三等品。在XCA-MobileViT增加了单个残差块内构造具有等级制的类残差连接，不同于以分层方式表示的多尺度特征，输出特征在粒度级别上表达多尺度特征并增加了每个网络层的感受野，能充分提取菌菇的表型特征，重点关注菌菇形态的显著特征，提高了相邻等级菌菇的检测准确率，仅将二等品

34、的8.739%检测为一等品或三等品。在测试集上进行消融实验证明本实验所提出模块的有效性。对测试集中的3 499幅大球盖菇图像进行客观评价，评价指标包括模型检测准确率和F1分，评价对比结果如表3所示。以MobileViT-xxs架构为基准网络，依次增加自适应分支模块、增加局部与全局特征融合、用XCA模块替换transformer模块、增加SA模块。经测试，基准网络模型对5类大球盖菇品质检测的平均准确率为95.37%，在基准特征提取网络中加入等级制的类残差连接块后，平均准确率提高0.37个百分点，证明其能够从大球盖菇细粒度特征中提取不同等级的特征信息，有效提高了模型对大球盖菇不同等级特征的提取能力

35、。在增加局部与全局特征融合后，准确率进一步提高0.37%。在此基础上，替换全局特征表达中的transformer模块，在XCA中对Q和K应用L2范数图 5 混淆矩阵分析表 3 消融实验基准网络自适应分支特征融合 XCASA 平均准确率/%平均准确率提升/%F1分/%F1提升/%95.37 93.94 95.74 0.37 94.42 0.48 96.11 0.37 94.98 0.56 96.79 0.68 95.83 0.85 97.71 0.92 97.02 1.19 左银华，等：基于改进 MobileViT 模型的大球盖菇品质分级实验研究 87 后将Q转置在通道维度上计算注意力

36、，可在此前基础上提升了0.68%的准确率。最后，在池化层之前添加SA模块，在通道和空间维度捕捉有用特征信息，准确率达到97.71%，F1分达到97.02%。测试结果表明，改进的MobileViT模块的四个关键改进点均可提高模型检测性能，其中XCA-MobileViT比MobileViT提升2.34个百分点。3.4 应用于大球盖菇分级任务的不同网络性能分析为定性评价XCA-MobileViT模型的检测结果，实验对XCA-MobileViT模型与三个轻量级CNN模型（MobileNetV215、ShuffleNetV216和GhoseNet23）、三个ViT模型（ViT12、Swin14和T2T

37、-ViT24）和两个混合模型（PVTv225和MobileViT17）在测试集上进行性能比较。为了确保实验公平性和数据有效性，所有网络在相同的软硬件环境下进行训练和测试。实验使用了相同的学习率衰减策略，将迭代次数设置为150，并保存在测试集上效果最好的模型，9种模型的对比实验结果如图6所示，靠左上角的模型具有较高的准确率、较小的参数量和计算量。可以直观看出，XCA-MobileViT优于其他模型，具体参数如表4所示。在与轻量级CNN的对比中，相较于MobileNetV2-0.5，XCA-MobileViT的FLOPs、参数量和权重空间分别减少178.8、1.829和5.24 M，准确率提高3.

38、8%。与ShuffleNet-1.0和GhostNet-1.0相比，FLOPs分别减少9.36和9.73 M，参数量分别减少0.859和3.509 M，权重空间减少1.376和11.83 M，准确率提高0.83%和3.49%。在同ViT的对比中，由于ViT-base计算复杂度与token的平方相关，导致FLOPs达到XCA-MobileViT的123倍，由于参数量巨大，模型的权重空间达到335.2 M，是XCA-MobileViT的90倍。Swin-tiny 的准确率达到97.22%，但它的FLOPs是XCA-MobileViT的31倍，参数量达到了27.52 M，是XCA-MobileViT

39、的68倍。在同轻量级混合模型PVTv2-B0的对比中，FLOPs、参数量、权重空间分别减少了393.2、3.009和9.663 M，准确率提高4.29%。对比原始MobileViT-xxs，准确率提高2.34%，FLOPs和参数量分别降低121.1和0.551 M。由上述对比实验结果可知，XCA-MobileViT在保证FLOPs和参数量尽可能小的前提下，拥有较高的准确率，更适合部署于大球盖菇的检测系统。表4展示了XCA-MobileViT与其他模型的具体对比结果，对精确率、召回率、F1分和平均准确率四个指标进行了详细分析。XCA-MobileViT模型与其他模型的计算量、参数量和权重空间的对

40、比结果如表5所示，其中计算量用图 6 XCA-MobileViT 与其他模型性能对比图表 4 XCA-MobileViT 模型与其他模型在大球盖菇等级数据集上的对比结果模型输入轮次预训练精确率/%召回率/%F1分/%平均准确率/%MobileNetV2-0.5 22423 150 No 92.48 91.84 92.10 93.91 ShuffleNetV2-1.0 22423 150 No 95.96 96.02 95.97 96.88 CNN GhostNet-1.0 22423 150 No 92.51 92.88 92.52 94.22 ViT-base patch16

41、22423 150 Yes1 93.64 94.04 93.78 95.22 Swin-tiny patch4 22423 150 Yes2 96.46 96.35 96.40 97.22 ViT T2T-ViT-7 22423 150 No 90.70 91.32 90.43 92.85 PVTv2-B0 22423 150 No 91.64 91.96 91.30 93.42 MobileViT-xxs 22423 150 No 94.10 94.04 93.94 95.37 Hybrid XCA-MobileViT 22423 150 No 96.92 97.16 97.02 97.71

42、注：1 ViT-base patch16在训练期间加载在ImageNet-21k上训练的预训练权重；2 Swin-tiny patch4 在训练期间加载在ImageNet-1k 上训练的预训练权重。88 实验技术与管理表 5 XCA-MobileViT 模型与其他模型参数对比结果模型浮点运算数/M*参数量/M*权重空间/M*MobileNetV2-0.5 319.03 2.275 2.230 5.561 8.957 2.409 ShuffleNetV2-1.0 149.58 1.066 1.260 3.142 5.093 1.370 CNN GhostNet-1.0 149

43、.95 1.069 3.910 9.750 15.55 4.183 ViT-base patch16 17264 123.1 86.39 215.4 335.2 90.18 Swin-tiny patch4 4464.6 31.83 27.52 68.62 107.8 29.00 ViT T2T-ViT-7 976.24 6.962 4.010 10.00 15.88 4.272 PVTv2-B0 533.45 3.804 3.410 8.503 13.38 3.599 MobileViT-xxs 261.28 1.863 0.952 2.374 3.862 1.039 Hybrid XCA-

44、MobileViT 140.22 1.000 0.401 1.000 3.717 1.000 注：*基于XCA-MobileViT各项指标的倍率。浮点运算数表征。3.5 补充实验为验证模型在其他菌菇数据集中的泛化性，选用两个公开菌菇分类图像数据集进行补充实验。使用蘑菇分类数据集（mushrooms classification dataset）进行菌菇多分类任务验证，使用蘑菇图片数据集（mushroom pictures dataset）进一步验证所提出模型的分类性能，并根据不同数据集特征对模型进行了微调（fine-tuned）。3.5.1 蘑菇分类数据集实验采用从kaggle平台下载的蘑

45、菇分类数据集，该分类数据集由9种不同的菌菇图像构成，为验证XCA-MobileViT在菌菇图像多分类任务中的泛化性，将原始数据按照64的比例随机分为训练集和测试集，并在原始数据上进行CutMix数据增强，最后统一调整图像尺寸为224224，蘑菇分类数据集详情如表6所示。使用轻量级CNN、ViT和CNN-Transformer混合模型在蘑菇图片数据集上进行实验，针对不同数据集对模型做出微调，并使用评估指标比较不同模型的性能。这些模型分别是MobileNetV2、ShuffleNetV2、GhostNet、ViT-base、Swin-tiny、T2T-ViT、PVTv2-B0、MobileViT和

46、XCA-MobileViT。蘑菇分类数据集的分类结果如表7所示，XCA-MobileViT表现最好。与实验的其他模型相比，所提出的XCA-MobileViT在召回率、特异度、F1分和平均准确率方面表现良好，分别为68.81%、96.56%、70.18%和73.78%。其精确率稍差的原因是该模型更注重捕获所有的正例。实验结果表明，XCA-MobileViT具有较好的局部和全局建模能力，具有良好的泛化性。3.5.2 蘑菇图片数据集实验在kaggel平台下载DAVID HARPER提供的蘑菇图片数据集。该数据集包含6种类型的菌菇图像，同样对蘑菇图片数据集进行CutMix数据增强，并划分为训练集和测

47、试集，蘑菇图片数据集详情如表8所示。采用同样方法对上述9种模型微调后进行实验。表 6 蘑菇分类数据集种类 Agaricus Amanita Boletus Cortinarius Entoloma HygrocybeLactarius Russula Suillus 形态训练集 212 450 641 502 219 190 938 688 187 测试集 140 300 426 334 145 126 625 458 124 总数 352 750 1067 836 364 316 1563 1146 311 表 7 XCA-MobileViT 模型与其他模型在蘑菇分类数据集上对比结果模

48、型输入精确率/%召回率/%特异度/%F1 分/%平均准确率/%MobileNetV2-0.5 22423 68.07 52.38 94.97 55.43 62.84 ShuffleNetV2-1.0 22423 68.06 62.42 95.86 63.41 68.48 CNN GhostNet-1.0 22423 42.07 31.05 92.53 29.28 45.44 ViT-base patch16 22423 71.05 66.42 96.25 68.06 71.32 Swin-tiny patch4 22423 68.85 66.72 96.24 66.76 71.17 ViT

49、 T2T-ViT-7 22423 74.16 65.16 96.36 67.38 72.85 PVTv2-B0 22423 70.58 68.12 96.21 68.05 70.57 MobileViT-xxs 22423 65.37 62.53 95.72 63.40 67.40 Hybrid XCA-MobileViT 22423 72.65 68.81 96.56 70.18 73.78 左银华，等：基于改进 MobileViT 模型的大球盖菇品质分级实验研究 89 表 8 蘑菇图片数据集种类 Amanita bisporigeraAmanita muscariaBoletus edu

50、lis Cantharellus Omphalotus olearius Russula mariae形态训练集 355 218 265 697 36 137 测试集 236 145 176 464 23 90 总数 591 363 441 1161 59 227 在蘑菇图片数据集测试中，XCA-MobileViT也取得了良好的分类效果，如表9所示。通过与其他模型进行比较，XCA-MobileViT的分类性能最好，准确率为78.92%，F1分达到66.78%。精确率稍差的原因与3.5.1同。实验结果再次表明，XCA-MobileViT在其他蘑菇图像分类任务中也具有良好的泛化性，从而证明了该架

下载提示：咨信网仅提供存储空间/不修改/不编辑

【自信AI创作助手】【自信AI导航】
1、请仔细预览页面，基本判断完整性，对于直接下载带来的问题请及时与客服沟通；下载的文档，不会出现我们的网址水印。
2、该文档所得收入（下载+内容+预览）归上传者、原创作者；如果您是本文档原作者，请点此认领！既往收益都归您。

同意并开始全文预览

举报此文档有问题？有机会获“体验VIP”奖励！

文档加载中……请稍候！
如果长时间未打开，您也可以点击刷新试试。

下载文档到电脑，查找使用更方便

10 金币 0人已下载

申诉本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请申请举报、认领或删除 立即下载

配套讲稿：: 如PPT文件的首页显示word图标，表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
特殊限制：: 部分文档作品中含有的国旗、国徽等图片，仅作为作品整体效果示例展示，禁止商用。设计者仅对作品中独创性部分享有著作权。
关键词：: 基于改进 MobileViT 大球盖菇品质分级实验研究左银华

咨信网温馨提示：
1、咨信平台为文档C2C交易模式，即用户上传的文档直接被用户下载，收益归上传人（含作者）所有；本站仅是提供信息存储空间和展示预览，仅对用户上传内容的表现方式做保护处理，对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿，我们不确定上传用户享有完全著作权，根据《信息网络传播权保护条例》，如果侵犯了您的版权、权益或隐私，请联系我们，核实后会尽快下架及时删除，并可随时和客服了解处理情况，尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确)，网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据，平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺，下载前须认真查看，确认无误后再购买，务必慎重购买；若有违法违纪将进行移交司法处理，若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传，付费前请自行鉴别，如您付费，意味着您已接受本站规则且自行承担风险，本站不进行额外附加服务，虚拟产品一经售出概不退款（未进行购买下载可退充值款），文档一经付费（服务费）、不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印，是因预览和防盗链等技术需要对页面进行转换压缩成图而已，我们并不对上传的文档进行任何编辑或修改，文档下载后都不会有水印标识（原文档上传前个别存留的除外），下载后原文更清晰；试题试卷类文档，如果标题没有明确说明有答案则都视为没有答案，请知晓；PPT和DOC文档可被视为“模板”，允许上传人保留章节、目录结构的情况下删减部份的内容；PDF文档不管是原文档转换或图片扫描而得，本站不作要求视为允许，下载前自行私信或留言给上传者【自信****多点】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权，请谨慎使用；网站提供的党政主题相关内容(国旗、国徽、党徽－－等)目的在于配合国家政策宣传，仅限个人学习分享使用，禁止用于任何广告和商用目的。
6、文档遇到问题，请及时私信或留言给本站上传会员【自信****多点】，需本站解决可联系【微信客服】、【 QQ客服】，若有其他问题请点击或扫码反馈【服务填表】；文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“【版权申诉】”（推荐），意见反馈和侵权处理邮箱：1219186828@qq.com；也可以拔打客服电话：4008-655-100；投诉/维权电话：4009-655-100。