基于迁移学习和卷积视觉转换器的农作物病害识别研究.pdf
《基于迁移学习和卷积视觉转换器的农作物病害识别研究.pdf》由会员分享,可在线阅读,更多相关《基于迁移学习和卷积视觉转换器的农作物病害识别研究.pdf(7页珍藏版)》请在咨信网上搜索。
1、第8期余胜 等:基于迁移学习和卷积视觉转换器的农作物病害识别研究1 9 1 D O I:1 0.1 3 7 3 3/j.j c a m.i s s n.2 0 9 55 5 5 3.2 0 2 3.0 8.0 2 6余胜,谢莉.基于迁移学习和卷积视觉转换器的农作物病害识别研究J.中国农机化学报,2 0 2 3,4 4(8):1 9 1-1 9 7Y u S h e n g,X i e L i.R e s e a r c h o n p l a n t d i s e a s e i d e n t i f i c a t i o n b a s e d o n t r a n s f e r
2、l e a r n i n g a n d c o n v o l u t i o n a l v i s i o n t r a n s f o r m e r J.J o u r n a l o f C h i n e s e A g r i c u l t u r a l M e c h a n i z a t i o n,2 0 2 3,4 4(8):1 9 1-1 9 7基于迁移学习和卷积视觉转换器的农作物病害识别研究*余胜,谢莉(韶关学院信息工程学院,广东韶关,5 1 2 0 0 5)摘要:农作物病虫害对粮食生产和质量都有很大影响。针对当前传统的农作物病害识别过程中主要依赖人工特征
3、提取,且真实环境下采集的病害图像样本数目较少,识别方法鲁棒性差、分类准确率偏低等问题,基于迁移学习提出了以卷积操作预处理图像子块的视觉转换器(V i s i o n T r a n s f o r m e r,V i T)模型用于农作物病害识别。在V i T模型结构的基础上引入卷积操作对输入图像进行预处理,卷积操作能提高获取底层特征的丰富度,进而在V i T学习过程中通过多头注意力机制,加大有用特征的权重,削弱噪声等无用信息的影响,达到模型提高特征学习能力并增强鲁棒性的目的。试验结果表明,利用迁移学习方法在i b e a n数据集上能够提升模型的识别准确率1 0%以上;模型最终在i b e a
4、 n数据集上识别准确率为9 8.1 2%,约有2%的提高,在P l a n t V i l l a g e数据集识别准确率为9 9.9 1%,都达到了当前最佳识别水平。提出的识别方法在复杂背景干扰下具有较高的识别准确率和鲁棒性,可以满足自然条件下的农作物病害识别的要求。关键词:迁移学习;卷积视觉转换器;病害识别;注意力机制中图分类号:S 5:T P 3 9 1.4 文献标识码:A 文章编号:2 0 9 5 5 5 5 3(2 0 2 3)0 80 1 9 1 0 7收稿日期:2 0 2 2年3月7日 修回日期:2 0 2 2年5月1 3日*基金项目:广东省自然科学基金项目(2 0 2 1 A
5、1 5 1 5 0 1 1 8 0 3);韶关市科技计划项目(2 1 0 7 2 8 1 1 4 5 3 0 7 9 6、2 1 0 7 2 8 1 0 4 5 3 0 5 8 6)第一作者:余胜,男,1 9 8 2年生,湖南娄底人,博士,讲师;研究方向为视频图像处理、目标识别与检测。E-m a i l:y s_x ms g u.e d u.c nR e s e a r c h o n p l a n t d i s e a s e i d e n t i f i c a t i o n b a s e d o n t r a n s f e r l e a r n i n g a n dc
6、o n v o l u t i o n a l v i s i o n t r a n s f o r m e rY u S h e n g,X i e L i(S c h o o l o f I n f o r m a t i o n S c i e n c e a n d E n g i n e e r i n g,S h a o g u a n U n i v e r s i t y,S h a o g u a n,5 1 2 0 0 5,C h i n a)A b s t r a c t:T h e p l a n t d i s e a s e s i m p a c t o n b
7、 o t h t h e f o o d p r o d u c t i o n a n d q u a l i t y i n t h e a g r i c u l t u r e s e c t o r.A s t h e p r o b l e m t h a t t r a d i t i o n a l p l a n t d i s e a s e i d e n t i f i c a t i o n m e t h o d s r e l y o n t r a i n i n g s a m p l e d a t a a n d m a n u a l e x t r a
8、 c t i o n o f f e a t u r e s,i t i s d i f f i c u l t t o i d e n t i f y i n t h e f i e l d e n v i r o n m e n t a n d t h e c l a s s i f i c a t i o n a c c u r a c y i s n o t h i g h.B a s e d o n t r a n s f e r l e a r n i n g,t h i s s t u d y p r o p o s e s a C o n v o l u t i o n a l
9、 V i s i o n T r a n s f o r m e r(C V i T)m o d e l t h a t p r e p r o c e s s e s i m a g e s u b-b l o c k s w i t h c o n v o l u t i o n o p e r a t i o n s f o r p l a n t d i s e a s e i d e n t i f i c a t i o n.O n t h e b a s i s o f t h e V i s i o n T r a n s f o r m e r(V i T)m o d e l
10、 s t r u c t u r e,t h e c o n v o l u t i o n o p e r a t i o n i s i n t r o d u c e d t o p r e p r o c e s s i n p u t i m a g e s,t h e c o n v o l u t i o n o p e r a t i o n i m p r o v e s t h e r i c h n e s s o f t h e l o w-l e v e l f e a t u r e s,a n d t h e n i n t h e V i T l e a r n
11、 i n g p r o c e s s,t h e m u l t i-h e a d m e c h a n i s m i s u s e d t o i n c r e a s e t h e w e i g h t o f u s e f u l f e a t u r e s a n d n o i s e s u p p r e s s i o n.S o a s t o a c h i e v e t h e p u r p o s e o f i m p r o v i n g t h e f e a t u r e l e a r n i n g a b i l i t y
12、 a n d e n h a n c i n g t h e r o b u s t n e s s o f t h e m o d e l.T h e e x p e r i m e n t a l r e s u l t s s h o w t h a t u s i n g t h e t r a n s f e r l e a r n i n g m e t h o d o n t h e i b e a n d a t a s e t c a n i m p r o v e t h e r e c o g n i t i o n a c c u r a c y o f t h e m
13、 o d e l b y m o r e t h a n 1 0%.A p p l y i n g t r a n s f e r l e a r n i n g t o t h e C V i T m o d e l a c h i e v e s a r e c o g n i t i o n a c c u r a c y o f 9 8.1 2%o n t h e i b e a n d a t a s e t,a n i m p r o v e m e n t o f a b o u t 2%.T h e r e c o g n i t i o n a c c u r a c y i
14、 n t h e P l a n t V i l l a g e d a t a s e t i s 9 9.9 1%.T h e p r o p o s e d r e c o g n i t i o n m e t h o d h a s h i g h r e c o g n i t i o n a c c u r a c y a n d r o b u s t n e s s u n d e r c o m p l e x b a c k g r o u n d i n t e r f e r e n c e,a n d c a n m e e t t h e r e q u i r
15、e m e n t s o f p l a n t d i s e a s e i d e n t i f i c a t i o n u n d e r n a t u r a l c o n d i t i o n s.K e y w o r d s:t r a n s f e r l e a r n i n g;c o n v o l u t i o n a l v i s i o n t r a n s f o r m e r;p l a n t d i s e a s e i d e n t i f i c a t i o n;a t t e n t i o n m e c h a
16、n i s m第4 4卷 第8期2 0 2 3年8月中国农机化学报J o u r n a l o f C h i n e s e A g r i c u l t u r a l M e c h a n i z a t i o nV o l.4 4 N o.8A u g.2 0 2 31 9 2 中国农机化学报2 0 2 3年0 引言粮食安全是国家安全的基础,而农作物疾病的防控是影响粮食安全的一个重要因素,及时准确地识别病害种类可以为农业生产提供有效的专业指导,从而提高农作物产量,减少经济损失12。在农作物病害识别中,传统机器学习方法将识别过程分为图像预处理、图像特征提取和分类三个步骤,其中特征
17、提取的结果是整个识别方法的基础,但特征提取方法往往需要丰富的经验和反复的试验,存在一定的主观性34。同时农作物病害图像存在背景复杂、病害目标区域不明显等特点,增加了特征提取与分类的难度。因此,基于传统机器学习的农作物病害疾病识别方法难以处理背景复杂的病害数据,且泛化能力较弱。随着硬件设备计算能力的提升和人工智能技术的飞速发展,深度学习在各行各业都取得了非常优异的成绩,如人脸识别、机器翻译和行人检测与识别等方面。在农作物病害识别方面,基于深度学习的识别方法相比于传统机器学习方法在识别准确率和识别速度上同样有很大的提升;在图像分类识别方面,卷积神经网络(C o n v o l u t i o n
18、a l n e u r a l n e t w o r k s,C NN s)是分类识别效果最佳的深度学习方法之一56;在农作物病害识别方面,C NN s也取得了较好的分类识别效果71 0。洪惠 群 等7为 了 扩 大 网 络 模 型 的 适 用 场 景,将S h u f f l e N e t网络中的R e L U激活函数用L e a k y R e L U激活函数代替,构建了轻量级神经网络用于农作物病害的识别。孟亮等8则以残差单元为基本网络结构设计了轻量级C NN s用于农作物病害识别。M o h a n t y等4构建了基于C NN s的识别模型,在P l a n t V i l l a
19、 g e数据集9上的识别准确率达到9 9.3%。马浚诚等1 0针对温室场景下黄瓜病害的卷积神经网络识别方法的平均准确率为9 5.7%。卷积神经网络强大的特征自主学习能力在农作物病害的识别方面取得了不错的成绩,但也存在卷积神经网络训练参数量大、网络收敛速度慢、严重依赖于训练样本 数 据 量 等 不 足。近 年 来,迁 移 学 习(T r a n s f e r L e a r n i n g,T L)1 11 3使得网络模型能快速适应目标学习任务,可以有效缓解过拟合,提升模型性能。赵恒谦等1 1提出迁移学习与分步识别相结合实现对农作物病害种类的识别。张建华等1 2将I m a g e N e t
20、-1 K数据集上预训练的VG G模型迁移到棉花病害数据集上,但I m a g e N e t-1 K数据集与棉花病害数据集相似度不大,迁移学习的知识没能很好地应用到目标数据集,最终识别准确率提升不明显。赵立新等1 3则首先在P l a n t V i l l a g e数据集上对模型进行预训练,然后在目标数据集棉花病害数据上对参数进行微调,获得平均9 3.5%的识别准确率。王东方等1 4基于迁移学习和残 差 网 络 提 出 农 作 物 病 害 识 别 模 型T L-S E-R e s N e X t-1 0 1,在真实环境下病害农作物的识别准确率明显高于未采用迁移学习的模型。以上的研究表明基于
21、深度学习的农作物病害的识别准确率和鲁棒性方面都要远远优于传统机器学习的方法,但当前基于卷积神经网络的方法大多是在背景单一的图像数据集上训练学习和测试。在真实环境的农作物病害识别过程中,由于受各种噪声的干扰,实际的识别准确率会大大降低,难以满足实际应用的需求。2 0 1 7年G o o g l e的 机 器 翻 译 团 队 成 员V a s w a n i等1 5完全抛弃卷积神经网络和递归神经网络结构,仅采用注意力机制实现机器翻译任务,并取得当时的最佳效果。受V a s w a n i1 5的启发,D o s o v i t s k i y等1 6尝试将T r a n s f o r m e r
22、应 用 到 计 算 机 视 觉 领 域,提 出V i s i o n T r a n s f o r m e r(V i T)模型。V i T包含输入图像分块、展平成序列、T r a n s f o r m e r编码和分类识别等模块,不依赖卷积神经网络结构,对噪声的干扰有很好的鲁棒 性,在 图 像 分 类 任 务 上 达 到 了 很 好 的 效 果,I m a g e N e t-1 K上的分类准确率达到8 8.5 5%。针对实际应用场景中包含复杂背景信息的农作物病害识别问题,本文在现有研究基础上,提出一种迁移学习与卷积视觉转换器(C o n v o l u t i o n a l V i
23、s i o n T r a n s f o r m e r,C V i T)模型相结合的农作物病害识别方法。1 病害识别模型1.1 卷积视觉转换器模型结构标准的T r a n s f o r m e r结构用于自然语言处理,输入为一维的标记嵌入(t o k e n e m b e d d i n g)向量。为有效处理输入图像,D o s o v i t s k i y等1 6首先将输入尺寸为2 2 42 2 4的图像共划分为互不重叠的1 9 6个1 61 6大小的图像块;然后通过线性投影变换将各图像块映射到7 6 8维度的一维向量;最后将1 9 67 6 8特征矩阵输入到T r a n s f
24、 o r m e r结构。而在实现农作物病害识别时,不同种类病害的表观特征往往仅有细微的表观区别,有效学习到病害图像的细粒度特征对农作物病害的识别至关重要。为此,将卷积 操 作 引 入 到V i T设 计 了 卷 积 视 觉 转 换 器(C o n v o l u t i o n a l V i s i o n T r a n s f o r m e r,C V i T)C V i T模型,其整体框图如图1所示。对比V i T模型中的线性映像操作,本文设计了一个用卷积层组来实现输入图像映射到二维特征矩阵的过程。卷积模块共包含N层卷积,输入图像经过N层卷积操作后将映射到1 41 47 6 8的特
25、征空间,并作为T r a n s f o r m e r结构的输入。第8期余胜 等:基于迁移学习和卷积视觉转换器的农作物病害识别研究1 9 3 图1 C V i T模型的结构框图F i g.1 A r c h i t e c t u r e f o r C V i T1.2 注意力机制注意力机制可以描述为将一个查询和一组键值对映射到一个输出,其中查询、键、值和输出都是向量。输出值通过加权总和计算得到,其中分配给每个值的权重由查询与相应键的兼容性函数计算。根据兼容性函数的不同,可以设计出不同的注意力机制,本文采用文献1 5 设计的缩放点乘注意机制。缩放点乘注意机制的结构如图2所示。图2 缩放点乘
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 基于 迁移 学习 卷积 视觉 转换器 农作物 病害 识别 研究
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【自信****多点】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【自信****多点】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。