基于耦合算法的花生叶片光合色素含量反演模型.pdf
《基于耦合算法的花生叶片光合色素含量反演模型.pdf》由会员分享,可在线阅读,更多相关《基于耦合算法的花生叶片光合色素含量反演模型.pdf(10页珍藏版)》请在咨信网上搜索。
1、基于耦合算法的花生叶片光合色素含量反演模型刘欣蓓1,苏涛1,雷波2,朱菲1,邸俊楠1,孟成1,徐良泉1,王仁义1(1.安徽理工大学空间信息与测绘工程学院,淮南232001;2.中国水利水电科学研究院水利研究所,北京100048)摘要:准确获取及预测光合色素含量可为精细化种植管理提供数据依据,为探究花生冠层叶片色素吸收特征,该研究以开花下针期的花生冠层叶片为研究对象,以 ASDFieldSpec4 野外便携式高光谱仪采集的光谱数据为数据源,进行花生叶片叶绿素含量和类胡萝卜素含量反演。通过对比 7 种单一筛选特征波长变量算法及结合 4 种模型(PLSR、SVR、GBDT 和 XGBoost)的结果
2、,优选出 3 种算法进行两两耦合。结果表明:1)在单一算法试验中 IRIV、UVE 和 GA 算法结果较优;2)在耦合算法试验中 UVE-IRIV、GA-IRIV 和 GA-UVE 方法都能有效降维,且模型稳定性提升。在叶绿素含量反演模型中,GA-IRIV-XGBoost 模型精度最高,R2=0.622,RMSE=0.235mg/g;在类胡萝卜素含量反演模型中,UVE-IRIV-XGBoost 模型精度最高,R2=0.575,RMSE=0.056mg/g;3)比较两种色素反演模型的预测精度,表明叶绿素的预测精度优于类胡萝卜素。该结果可为快速、准确预测花生叶片光合色素含量提供一种方法。关键词:作
3、物;高光谱;花生叶片;光合色素;特征波长变量;耦合算法;XGBoostdoi:10.11975/j.issn.1002-6819.202303063中图分类号:TP391文献标志码:A文章编号:1002-6819(2023)-16-0198-10刘欣蓓,苏涛,雷波,等.基于耦合算法的花生叶片光合色素含量反演模型J.农业工程学报,2023,39(16):198-207.doi:10.11975/j.issn.1002-6819.202303063http:/www.tcsae.orgLIUXinbei,SUTao,LEIBo,etal.Inversemodelforthephotosynthet
4、icpigmentcontentofpeanutleavesusingcouplingalgorithmJ.TransactionsoftheChineseSocietyofAgriculturalEngineering(TransactionsoftheCSAE),2023,39(16):198-207.(inChinesewithEnglishabstract)doi:10.11975/j.issn.1002-6819.202303063http:/www.tcsae.org0引言花生作为中国重要的经济和油料作物,富含油脂、蛋白、膳食纤维及微量营养素,具有丰富的功能成分和极高的营养价值,保
5、障其产量的稳定性对于中国油料安全至关重要1。色素是植物进行光合作用的重要物质基础,主要包括叶绿素(Chlorophyll,Chls)和类胡萝卜素(Carotenoids,Caros)。叶绿素含量与植被的光合能力、生长发育以及营养状况有密切的关系,可有效反映其胁迫、生长和衰老等状况2。类胡萝卜素能吸收和传递太阳辐射能,在植被光能过剩时,还可以发散过剩能量来保护光合系统3。因此,快速准确预测叶片光合色素含量对花生生长监测、营养诊断、产量评估和病虫害的早期预警等科学化管理有重要价值4。传统的光合色素含量检测方法技术投入大,受环境影响,消耗时间长且为有损检测5。由于高光谱遥感技术具有高效、无损等优势,
6、因此,现已广泛应用于作物生理指标及生长状态的快速检测6-7。马春艳等8对冬小麦光谱数据与叶绿素含量进行分析与建模,验证光谱反射率与叶绿素含量呈正相关性。柳维扬等3采用不同的建模方法构建枣树冠层色素的光谱定量反演模型,结果表明利用光谱数据预测色素含量的精度较高。然而以往此类研究中对作物生理指标预测,忽略了叶片近红外光谱的吸收峰重叠严重,导致光谱中冗余信息较多,影响高光谱预测色素含量模型的精度9。因此,如何更好地去除冗余信息,对提升模型运行效率、简化模型结构和增强模型稳定性具有重要的应用价值7。变量筛选算法是常见的对高光谱波段进行信息挖掘的方法。筛选方法可分为 2 类,一类是以变量数理统计特征为基
7、础,主要包括无信息变量消除法(uninformativevariableelimination,UVE)10、竞争性自适应重加权取样法(competitiveadaptivereweightedsampling,CARS)11、连续投影算法(successiveprojectionsalgorithm,SPA)12和相关系数分析法(correlationcoefficient,CC)13等。另一类是基于智能优化算法的特征波长寻优方法,主要有遗传算法(geneticalgorithm,GA)14、灰狼算法(greywolfoptimizationalgorithm,GWO)15、随机蛙跳算法(r
8、andomfrog,RF)16-17等。刘爽等18应用CARS 和 SPA 等算法筛选光谱特征变量并建立大豆生理信息模型,校正集和预测集的相关系数 Rc和 Rp值提升至 0.944 和 0.911。YUAN 等13使用 CC 和 IRIV 等算法筛选特征波段并建立辣椒叶片相对叶绿素含量反演模型,决定系数 R2cv和均方根误差 RMSEcv分别达到 0.81 和2.76。但此类基于高光谱技术检测作物生理指标的研究常采用单一算法进行特征变量提取,尽管这些算法可剔除部分包含冗余信息的变量或可全局搜索有效信息变量,但单独使用时仍存在保留变量过多、筛选结果存在较低信噪比变量或运算过程耗时长、模型参数复杂
9、且难以彻底搜索所有可能变量组合等不足9。因此,寻找一种更合适的高光谱数据特征提取方法和更简洁的预测模型,以解决花生叶片光合色素含量的无损检测问题。本文针对以上研究中的问题,尝试在单一变量筛选算法基础上,对提升模型精度效果最佳的部分算法进行耦合,拟通过提取最少量有效信息变量,简化模型结构,提高预测模型精确性及稳定性,为精准快速且无损的检收稿日期:2023-03-10修订日期:2023-08-09基金项目:安徽理工大学引进人才科研启动项目(ZY030);国家重点研发计划项目(2018YFC0407703)作者简介:刘欣蓓,研究方向为农作物无损检测与高产优质栽培。Email:通信作者:苏涛,博士,副
10、教授,研究方向为定量遥感及其在农业中的应用。Email:第39卷第16期农 业 工 程 学 报Vol.39No.161982023年8月TransactionsoftheChineseSocietyofAgriculturalEngineeringAug.2023测花生光合色素含量提供思路。1材料与方法1.1研究区概况试 验 区 位 于 安 徽 省 淮 南 市 田 家 庵 区 农 田(323358.11N,117111.54E),位置如图 1 所示。试验区地处亚热带季风气候和暖温带季风气候的过渡地带,受自然条件影响,淮南农作物具有明显的区域性和季节性。主要的农作物有水稻、小麦、玉米、油菜、花生
11、等,综合生产能力较强。117120E117120E117110E117110E32340N32340N323350N323350Nb.研究区田块b.Fields in the study area02040608010km07515022530037.5m试验农田Experimental farmland田家庵区Tianjiaan district淮南市边界 Border of Huainan city11700E11700E116300E116300E3300N3300N32300N32300N3200N3200Na.研究区位置a.Location of the study area图 1研
12、究区位置及田块分布Fig.1Locationandfielddistributionofstudyarea1.2数据源与预处理1.2.1数据源试验于 2023 年 6 月 27 日 10:0014:00 时进行,试验当天天气晴朗且无风无云。研究选用花生物候期的开花下针期,在选定的研究区范围内,划分 100 个采样区域进行样本采集。采用AnalyticalSpectralDevices(ASD)分析光谱仪器公司生产的 FieldSpec4 型地物光谱辐射仪采集花生冠层叶片反射光谱,采集现场如图 2。该仪器的光谱波长范围为 3502500nm,采样间隔为 1.4nm(3501000nm)、2nm(
13、10002500nm)。光谱仪使用前预热 20min,每次测量前进行标准白板校正。测量时探头始终保持垂直向下,距离花生冠层叶片高度大约 50cm,对每个区域选取的采样点重复测量 5 次,取平均值作为该样本反射光谱测量结果,试验共采集 69 个花生叶片样本。图 2花生叶片数据测量Fig.2Measurementofpeanutleafdata花生样本叶片色素含量的测定采用分光光度法。在光谱测量完成后将样本叶片剪下放入密封袋中,及时放入 4 冰箱内避光冷藏带回实验室。剪取主叶脉两边的叶片 0.2g,将样品剪碎研磨后加入 95%的乙醇定容至25ml,置于暗室浸提 24h,浸提后的溶液用分光光度计分别
14、对波长 470、649 和 665nm 进行测定,通过计算可得样本中叶绿素 a、叶绿素 b 和类胡萝卜素含量,其中叶绿素 a、b 含量之和为叶绿素总含量。表 1 对样本数据集色素含量进行描述性统计。1.2.2数据预处理试验使用的光谱仪测定波长范围是 3502500nm,已有的研究结果表明,叶片光谱在可见光波段与光合色素呈较强相关性9,故截取 4001000nm 作为本次研究波长范围。地面高光谱数据受自身和背景环境等多种因素影响,为消除噪声等干扰因素对模型精度的影响,本研究采用 Savitzky-Golay 卷积平滑(SG)结合标准正态变换(standardnormalvariatetransf
15、ormation,SNV)的预处理方式18,有效过滤噪声,提高信噪比,同时减弱表面散射以及光程变化对漫反射光谱的影响19。表1数据集色素含量的描述性统计Table1Descriptivestatisticsofthepigmentcontentofthedataset样本类型Typeofsamples样本数Numberofsamples叶绿素Chlorophyll/(mgg1)类胡萝卜素Carotenoids/(mgg1)最小值Min最大值Max平均值Mean标准差Standarddeviation 最小值Min最大值Max平均值Mean标准差Standarddeviation建模集Calib
16、rationset460.9102.4701.8090.3440.1990.4070.2940.069验证集Validationset231.0782.4341.7350.3820.0620.3850.2530.0851.3特征波长筛选方法将预处理后的光谱数据分别通过 CC、RF、UVE、SPA、CARS、IRIV 和 GA7 种单一变量筛选算法进行特征波长提取。CC 法计算光谱矩阵中每个波长和样本色素含量的相关系数,其相关系数值的绝对值越大,波段所包含的信息就越多18,将 4001000nm 整个波段的原始光谱反射率分别与花生叶片叶绿素含量、类胡萝卜素含量进行相关性分析,通过 P=0.05
17、的显著性水平检验,选取相关系数绝对值较大的波长;RF 法通常选择概率值较高的部分变量,或人为设置一个概率阈值,取概率值高于阈值的变量作为特征波长变量20。本研究 RF 法参数设置为运行次数 N 为 10000次,主成分个数 A 为 10,蛙跳初始模型中的变量数 Q 为 2;UVE 法由 PLSR 回归系数衡量变量相关性,引入变量稳定指数第16期刘欣蓓等:基于耦合算法的花生叶片光合色素含量反演模型199作为筛选标准,消除在阈值线之间具有稳定性的无信息变量21;SPA 法运算过程中不同的波长子集分别建立不同的多元线性回归模型,分别计算模型的 RMSE 值22;CARS 法中的蒙特卡罗采样会随不同采
18、样次数得出不同的运算结果,因此试验设定不同的采样次数独立运算来筛选相对较好的变量23。本试验经过验证,将采样次数设为 50 次时呈现最佳运算结果;迭代保留信息变量法(iterativelyretainsinformativevariables,IRIV)24经过多次测试后确定最大主成分个数为 10,交叉验证次数为 10;GA 法进行特征波长提取,其参数设置为群体数目 69,交叉概率 0.5,变异概率 0.01,迭代次数 100 次,依照上述参数独立运行 GA100 次,每次输出 01 二进制编码字符串,计算波长点标识为“1”的概率25。但单一算法在筛选特征波长时仍存在一些局限性,如保留变量冗余
19、度高、共线性强,导致模型运行速度缓慢。因此,本试验通过建立单一算法筛选特征波长变量模型,根据模型评价指标优选出 3 种最佳的算法进行两两耦合,利用耦合算法对高维光谱数据进行降维,简化模型结构,提升模型精度。1.4模型建立与评价本试验使用偏最小二乘回归(partialleastsquaresregression,PLSR)26、支持向量回归(supportvectorregression,SVR)27-28、梯度提升树(gradientboostingdecision tree,GBDT)29和 极 端 梯 度 提 升(extremegradientboosting,XGBoost)30这 4种
20、模型来建立花生叶片色素含量预测模型。使用等间隔抽样法将 69 个样本以 2:1 的比例划分为 46 个建模样本集和 23 个验证样本集。本研究以单一算法和耦合算法所筛选的特征波长作为输入变量,构建花生叶片光合色素含量反演模型,通过模型的精度评估耦合算法的可行性。模型的预测精度由决定系数 R2和均方根误差 RMSE 的参数确定。R2反映了模型建立和预测的稳定性,R2值越接近于 1,表明模型的稳定性及拟合度高;RMSE 值(RMSE)越接近于 0,表明模型预测能力越强。2结果与分析2.1单一算法波长筛选结果CC 法筛选花生叶片特征波长结果如图 3a、3b。4005006007008009001 0
21、000.60.40.200.20.40.64005006007008009001 0000.80.60.40.200.20.40.60.84005006007008009001 00000.10.20.30.40.54005006007008009001 00000.10.20.30.40.502004006008001 0001 200302010010203002004006008001 0001 20030201001020300510152025300.200.240.280.320.360.40051015202530350.0280.0320.0360.0400.044波长Wave
22、length/nm 相关系数Correlation coefficient 波长Wavelength/nm相关系数Correlation coefficient波长Wavelength/nm 选择概率Selection probabilitya.CC(Chls)c.RF(Chls)e.UVE(Chls)g.SPA(Chls)波长Wavelength/nm选择概率Selection probability变量个数Number of variables稳定性Stability波长变量Wavenlength variables波长变量Wavenlength variables随机变量Random v
23、ariables随机变量Random variables变量个数Number of variables稳定性Stability模型中变量的数量Number of varibles including in the model均方根误差RMSE/(mgg1)模型中变量的数量Number of varibles including in the model均方根误差RMSE/(mgg1)b.CC(Caros)d.RF(Caros)f.UVE(Caros)h.SPA(Caros)图 3CC、RF、UVE 和 SPA方法筛选特征波长Fig.3Characteristicwavelengthsselec
24、tedbyCC(correlationcoefficient),RF(randomfrog),UVE(uninformativevariableelimination)andSPA(successiveprojectionsalgorithm)algorithm200农业工程学报(http:/www.tcsae.org)2023年分别选取阈值线0.3(Chls)和0.55(Caros),筛选出特征波长变量分别为 196 和 271 个;图 3c、3d 为RF 法运行后每个波长变量被选择的概率,选取 0.1 为阈值,分别得到满足条件的 51(Chls)和 61 个(Caros)波长变量;图 3e
25、、3f 为 UVE 法变量稳定性分析结果,左侧曲线为光谱变量矩阵,右侧为添加的与光谱变量数相同的随机噪声矩阵,图 3e 阈值线分别为 21.3036 和22.3373,图 3f 阈值线分别为 20.6628 和17.8079,两阈值线之间为被剔除的无用变量,阈值线外分别筛选出32(Chls)和 30 个(Caros)波长变量;SPA 法运行过程中随变量数的增加,RMSE 值整体趋势下降,图 3g 中方框表示当 RMSE 为最小值 0.23053mg/g 时,对应的子集包含 23 个波长,图 3h 中 RMSE 为最小值 0.02743mg/g时,对应的子集包含 24 个波长,筛选出的两个子集即
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 基于 耦合 算法 花生 叶片 光合 色素 含量 反演 模型
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【自信****多点】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【自信****多点】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。