基于基因表达式编程的植物形态建模智能化方法.pdf
《基于基因表达式编程的植物形态建模智能化方法.pdf》由会员分享,可在线阅读,更多相关《基于基因表达式编程的植物形态建模智能化方法.pdf(8页珍藏版)》请在咨信网上搜索。
1、第 29 卷第 1 期农 业 工 程 学 报Vol.29No.11342013 年1 月Transactions of the Chinese Society of Agricultural EngineeringJan.2013基于基因表达式编程的植物形态建模智能化方法丁维龙1,2,胡辰1,程志君3,徐利锋1(1.浙江工业大学计算机科学技术学院,杭州 310023;2.浙江省可视媒体智能处理技术研究重点实验室,杭州 310023;3.浙江工业大学科学技术研究院,杭州 310014;)摘要:针对人为操作 L 系统进行植物形态建模时存在盲目性和低效性的问题,该文提出一种智能化的植物形态可视化建模
2、方法。该方法利用基因表达式编程思想自动获取 L 系统产生式规则,进而模拟出特定的植物形态结构。在分析现有工作的基础上,提出限制性的初始种群设计策略和种群个体选择策略,以缩小算法的搜索范围;提出一种综合外围轮廓比较和 Hausdorff 距离计算的个体适应度评价函数,以自动筛选出每一代中的优良个体。该方法使用 OpenGL 在 NVIDIAGeForce3 图形硬件上实现。试验结果表明,该方法不仅能逼真地模拟指定植物的三维形态,还可以仿真出形态各异的植物图形。该方法可为虚拟植物建模提供参考。关键词:基因表达,算法,模型,L 系统,植物形态建模,智能化方法doi:10.3969/j.issn.10
3、02-6819.2013.01.018中图分类号:TP391文献标志码:A文章编号:1002-6819(2013)-01-0134-08丁维龙,胡辰,程志君,等.基于基因表达式编程的植物形态建模智能化方法J.农业工程学报,2013,29(1):134141.Ding Weilong,Hu Chen,Cheng Zhijun,et al.Intelligent modeling method for plant morphology based on gene expressionprogrammingJ.Transactions of the Chinese Society of Agricu
4、ltural Engineering(Transactions of the CSAE),2013,29(1):134141.(in Chinese with English abstract)0引言近年来,以植物形态结构为对象的计算机建模与可视化仿真,已成为计算机图形学、农林学及生态学等领域中的研究热点之一。借助这种能精确描述植物空间规律的模型,研究者们可以方便地开展植物与环境因子相互作用定量化关系方面的研究1-3,比如光在植物冠层内的分布与传输规律4-5、农田精准施药6与病虫害防治7、植物结构与功能互反馈机理8、虚拟修剪9等。不仅如此,这种模型还可以被应用于三维动画片的制作、虚拟场景的生成
5、、影视特技与广告创意的制作、园林规划等需要逼真再现自然景观的场合。因此,其研究在多种领域均具有重要的理论意义与实用价值。自上世纪 80 年代以来,已有很多学者致力于植物形态可视化建模方面的研究,提出了很多有效的方法和模型。它们大致可分为三类:基于过程的方法10-13,主要考虑使用某种数学模型来模拟植物收稿日期:2012-07-10修订日期:2012-09-03基金项目:国家自然科学基金项目(60901081),浙江省科技厅公益应用技术研究类项目(2012C32003)。作者简介:丁维龙(1975),男,副教授,博士,硕士生导师,主要研究方向为虚拟植物建模。Email:。农业工程学会会员:丁维龙
6、(E041200291S)的生长或形态特征,主要包括 L 系统、参考轴技术、双尺度自动机等;基于图像的方法14-17,通过对一幅或多幅植物图像的分析和处理,提取植物的三维形态信息,在此基础上模拟出植物的形态结构;基于大规模测量数据的方法18-21,则先通过对植物体的精确测量,再利用可视化技术模拟出植物的形态结构。使用这种方法建立的模型,可用来研究与植物空间结构有关的定量、定性特征。分析上述方法或模型,可以发现它们有些共同的特点:一次建模过程只能模拟一株植物,如果要模拟多棵植物,则需要多次重复同样的参数设置和建模过程,导致建模的效率较低;在建模过程中都需要大量的人工干预22。比如,使用 L 系统
7、进行植物形态建模,需要预先确定其所需的规则参数(如迭代公理和产生式规则集)。传统的规则参数获取方法,主要依靠人工操作,存在着主观性强、效率低及工作量大等缺点,越来越不适应虚拟植物建模的需要。基于图像的方法目前也无法做到完全自动地从图像中分离出植物的几何结构和拓扑结构。而基于大规模测量数据重建的方法也需人工进行数据测量及对数据的处理。因此,如何减少建模过程中的人工干预,如何自动而又快速地获取模型所需要的参数,成为该领域研究者高度关注的问题。为提高过程模型的建模第 1 期丁维龙等:基于基因表达式编程的植物形态建模智能化方法135效率,国内外已有不少学者尝试将多种进化方法应用于求解 L 系统产生式规
8、则及其参数。比如,文献23-25基于遗传算法研究了 D0L 系统的产生式规则和迭代公理的提取问题,以模拟特定的二维植物结构。由于针对的是简单的二维植物结构和最简单的 L 系统,故此类研究中遗传个体的编码方式、遗传操作和适应度函数的设计,无法直接应用于三维情况。Venter 等26基于基因表达式编程思想,通过进化操作生成形态各异的三维植物形态。但在他们的研究中,优良个体的选择是通过人机交互的方式由用户基于自己的经验选择的。其选择依据为:个体的形态是不是符合用户的审美、或者是不是有趣等27。这种基于视觉效果的人工选择方法,因受限于屏幕尺寸和人的评判能力而导致搜索效率极低。因此,需研究专门的适应度评
9、价函数,由系统自动地搜索优良个体。本文提出一种用以模拟特定植物形态的智能化模拟方法。该方法结合 L 系统文法规则和基因表达式编程思想,通过进化操作和个体适应度值的计算,不仅可以获得大量形态各异的三维植物图形,还可以模拟用户指定种类的植物外形。本文是在文献26的基础上开展的研究。与之相比,本文的创新之处在于:提出一种初始种群限制性个体设计策略,能够有效限制算法的搜索范围,从而提高算法的搜索效率;提出一种综合外围轮廓比较和Hausdorff 距离计算的个体适应度评价函数,可以自动筛选出每一代中的优良个体。1基于基因表达式编程的植物形态模拟概述基于基因表达式编程的植物形态模拟方法,把基因表达式编程和
10、 L 系统有机结合起来。其具体步骤是26:种群中的个体由固定长度的染色体组构成,每条染色体分别与L系统的公理或某条产生式规则相对应;染色体由若干基因组成,基因的取值来源于L 系统的字符集或参数集。采用完全随机的方式生成初始种群中的个体;对初始种群中的个体进行变异、移项和交叉等遗传操作,生成新一代的种群。对于新一代种群中的个体,使用可视化技术对其染色体组所对应的 L 系统字符串进行图形化绘制,然后通过人机交互的方式,由用户基于图形的视觉效果选择优良的个体,形成新一代的种群。重复此进化过程,直至获得满意解。1.1L 系统简介L 系统是一种字符串重写系统,它由一个公理和若干产生式组成10。公理 是由
11、字符集中的字符所组成的字符串,用来表示系统的初始状态。产生式由前驱和后继两部分组成,其中前驱为字符串中的目标字符,而后继为目标字符的重写规则,由字符集中一个或多个字符组成。然后,使用产生式规则集对公理进行有限次迭代,生成字符发展序列,并对新产生的字符串进行几何解释,从而生成复杂的分形图形28。1.2编码方式与初始种群文献26使用固定长度的线性字符串存储染色体信息。个体由染色体组c0,c1,cnc-1构成(如图 1),其中 ci表示一个染色体,nc表示染色体组所包含染色体的个数。而染色体又由多个基因g0,g1,gng-1构成,ng表示单个染色体包含的基因总量。染色体 c0对应为 L 系统的公理,
12、染色体 c1cnc-1则分别与一个个产生式规则相对应。nc和 ng的值在同一个种群中保持不变。基因 gi表示参数化 L系统的字符控制单元,分为头部 hgi和尾部 tgi。a0表示头部 hgi的基因位,a1、a2表示尾部 tgi的基因位。头部字符来源于 L 系统的字符集合,使用符号编码方式。而尾部则由非负整数构成,使用二进制编码方式。当遗传操作结束后,再通过预先定义的映射规则,把二进制编码形式解码为原来的参数形式,然后通过字符串迭代生成新一代的个体。为提高种群的多样化程度,该文采用完全随机的方式生成初始种群中的个体。图 1染色体组结构Fig.1Structure of chromosomes1.
13、3遗传操作在文献26中,遗传操作包括变异、移项和交叉。变异是把每一个基因 gi以概率 pm将字符头部随机地替换为 L 系统字符集中的其他字符,同时把基因尾部中的参数随机地变化为其他值。移项操作是把染色体中的一段字符序列转移到染色体中的其他位置。它包括 2 种方式:在染色体中随机选择一段短字符序列,用来替换染色体中其他位置的字符序列;把染色体中的一个基因转移到染色体的头部,而其他基因位向后移。交叉操作可以使不同个体交换遗传物质。根据交叉位置的不同,可分为一点交叉、2 点交叉和基因重组 3 种方式。一点交叉农业工程学报2013 年136和 2 点交叉分别选择一个点位和 2 个点位对对应的染色体对进
14、行重组。而基因重组则是选择 2 个个体对应点位上的单个基因进行交换。1.4适应度评价函数文献26没有设计具体的个体适应度评价函数,而是由人工基于图形的视觉效果选择优良个体组成新的种群,再进行下一次的迭代。2改进的算法2.1初始种群设计Johannes Venter 等的工作26,采用完全随机的方式产生初始种群中的个体。这种方式是完全盲目的,势必产生很多违背 L 系统文法规则的个体。如果这类个体在种群中所占的比例较大,那么搜索空间就会太大,从而导致搜索效率很低。植物的形态结构主要由节点的分枝数量、分枝长度、分枝角度和旋转角度控制。这些形态参数的变化,可以生成不同的形态结构。因此,在初始化种群个体
15、时,可以根据特定植物的结构特点,对个体的染色体形式进行限制。为此,本文提出一种限制性的初始种群设计策略,通过对个体染色体基因的控制,从而控制初始个体的产生式规则。对染色体基因的控制,主要是通过对每个染色体的 g0基因和产生分枝的基因个数进行控制。初始种群设计策略为:Step 1:设染色体 c0的 g0基因为枝干基因,染色体 c1cnc-1的 g0基因为分枝方向控制基因;Step 2:for(i=0;inc-1;i+)for(j=1;jng-1;j+)从 L 系统的字符集合中随机选择一个字符作为染色体 ci的第 j 个基因 gj的头部 hgj;根据头部 hgj的字符类型确定基因 gj的尾部 tg
16、j的值。;Step 3:设染色体中产生分枝的基因个数为 N,if(N 目标植物的最大分枝数 Max_num)go to Step 4;elsego to Step 5;Step 4:在需要修正的染色体中,随机选择N-Max_num 个产生分枝的基因,使它们变异为其他类型的基因;Step 5:输出个体的染色体组。2.2适应度函数设计自然界中相同种类的植物有着相似的外形轮廓。通过比较植物的外形轮廓,可以大致区分植物种类的不同。因此,在模拟特定种类的植物时,通过比较进化过程中生成的仿真植物与真实植物在外部形态上的差异,可以筛选出与真实植物外形相似的优良个体。然后对被选中个体的形态结构再进行深入地分析
17、计算,从而获得每一代中的优良个体。受自然因素的影响,植物的轮廓并不是完全的对称。故设树冠最宽的一面为正视面(Z),从上向下俯视植株得到的面设为俯视面(X),把与正视面夹角为 90 且垂直于俯视面的面设为侧视面(Y),如图 2 所示。将植株在正视面、侧视面和俯视面上分别进行投影,从而得到 3 个二维轮廓图。分别计算每个轮廓图的几何数据,包括根节点坐标、顶端坐标、最左端坐标和最右端坐标。根据这4 个点坐标,得到植株轮廓最小包围四边形,并求得植株的高度 h 及宽度 W,以及四边形的 4 个角,如图 3。图中,1、2、3、4、分别为四边形的 4个内角(o)。高度 h 及宽度 W 为相对长度,无量纲。图
18、 2投影平面Fig.2Projection planes注:P4为根节点坐标、P2为顶端坐标、P1为最左端坐标、P3为最右端坐标;h 为植株的高度;W 为宽度;1、2、3、4、分别为四边形的 4个内角,()。图 3植株正面投影的最小包围四边形Fig.3Minimum-parallelogram of plant positive projection将目标植物和每代中产生的所有仿真个体分别在 X、Y 和 Z 面上进行投影,并计算出它们各自的轮廓参数(如 W、h),然后利用公式(1)分别求得目标植物和仿真个体在各个投影面上的适应度值 fx、fy和 fz。41/11000/000ooooooRiR
19、RvvvioooivvvioooovvviHWhwhwfBigValuehw、或(1)式中,HR、WR分别为目标植物轮廓的高和宽,o 是第 1 期丁维龙等:基于基因表达式编程的植物形态建模智能化方法137投影面的通称(o=x,y,z),hv和 wv分别为仿真个体轮廓的高和宽,oRi和ovi分别为目标植物和仿真个体的轮廓四边形的角度参数,BigValue 取经验值。由于轮廓适应度值fo只是对轮廓的几何信息进行比较,不能完全反应 2 个轮廓的相似性。为此,对目标植物图形和仿真植物图形的顶点坐标集合(P1、P2、P3、P4)之间的距离再进行计算,以进一步判定它们之间的相似性。Hausdorff 距离
20、是描述两组点集之间相似程度的一种量度方法,已被大量应用到图像配准的研究领域中29。令描述仿真植物形状的点集为 V,描述真实植物形状的点集为R,利用 Hausdorff 距离计算方法,分别计算出 3 个投影面上点集 Vo和点集 Ro之间的距离 Hx、Hy和Hz。计算公式如下,max,oooooooHR Vh R Vh VR(2),maxminoooooy Vx RhR Vxy(3),maxminooooox Ry VhVRyx(4)式中,|是点集 Ro和 Vo之间的距离范式。x,y 分别为轮廓点集 Ro和 Vo中的点。在上述过程中,由于仿真植物个体和真实植物的比例尺不同,还需在对它们各自点集坐标
21、进行归一化后,才能使用 Hausdorff 距离公式计算其轮廓的相似性。借鉴文献23中适应度函数的设计形式,对轮廓适应度值 fo和 Hausdorff 距离 Ho进行加权平均,从而得出计算仿真个体适应能力的适应度函数:XYZXYZrafbfcfdHeHfHfabcdef(5)式中,af 为各个侧面适应度值的权重系数。权重系数根据各侧面投影对植株形态的影响程度来确定。在本文中,假定 Z 面上的投影轮廓对植株的形态影响较大,Y 面上的投影轮廓对植株形态的影响次之,俯视面X上投影轮廓对植株的形态影响最小。经过多次实验,确定 fx、fy、fz、Hx、Hy、Hz的权重a、b、c、d、e、f 分别取 0.
22、1、0.3、0.6、0.1、0.3、0.6。2.3遗传操作的设计对于变异、移项和交叉这几种遗传操作,采用与文献26相同的方法。在选择个体进行遗传操作时,利用轮盘赌选择法30进行个体选择。为减小不良性状对优良性状的影响,使用改进的最优个体保存策略选择优良个体。改进的策略为:Step1:根据种群中个体的适应度值,对个体从小到大进行排序。Step2:求种群中所有个体适应度的平均值Evalue;对于种群中的任意一个个体,判断其适应度值与 Evalue 的关系;若个体的适应度值大于Evalue,则用该个体设为非优良个体;反之,将其设为优良个体。Step3:判断排序位于后十位的个体的适应度值是否超过了临界
23、值,并记录个体适应度值超过平均值的个体的数目 N。Step4:将适应度值超过临界值 Evalue 的 N 个个体替换为排序位于前 5 位的个体,形成新的种群。3结果与分析在 Visual Studio 2005 编程环境下,采用 C+语言和 OpenGL 图形渲染引擎,对上述算法进行了实现。算法流程如图 4 所示。试验用计算机的硬件配置为 Inter i5-750(2.67GHz)CPU,4GB 内存,NVIDIA GeForce3 显卡(1GB 显存)。图 4算法流程图Fig.4Fowchart of algorithm以模拟图 6a 所示的枫树为例,对本文算法进行试验验证。考虑到种群的进化
24、速度和计算机屏幕尺寸对每一代中个体数量的限制,初始种群中个体的规模 no设置为 20。对于个体中染色体的数量 nc,则借鉴文献26进行参数设置。染色体中基因的数目 ng为经验值。系统中 L 系统字符串的迭代次数初始化为 3。当通过算法找到模拟特定目标形态的 L系统规则及参数后,可以任意更改其迭代次数,以达到满意的模拟效果。一点交叉、2 点交叉和基因重组的发生概率与文献26中的设置相同。而变异、IS 插串、基因转换的发生概率值则小于文献26中设置的数值,在本文中都设置为 0.02。通过试验发现,如果这 3 种操作的发生概率较大,则会在种群中生成很多不符合植物学规律的非法个体,使得算法的搜索空间过
25、大。农业工程学报2013 年138对于进化终止条件的选择,我们从 2 个角度考虑:算法的时间效率和个体适应度值的变化规律。通过试验分别记录种群进行 50 代进化、100 代进化和 150 代进化所用的时间,并且对这三种情况各运行 20 次,分别求出它们所需的平均时间为:1.66 s、3.37 s、5.06 s。可以看出,随着进化代数的提高,程序运行所花费的时间呈线性增长。为求得个体适应度值与进化代数的关系,设进化代数为150 代,重复运行程序100 次,记录每次运行中每代群体中最优个体的适应度函数值。将获得的100 组数据随机平均分成 4 组,求出各组数据中每一代的最优个体的适应度平均值。然后
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 基于 基因 表达式 编程 植物 形态 建模 智能化 方法
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,个别因单元格分列造成显示页码不一将协商解决,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【二***】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【二***】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。