一种带有附加记忆策略的改进教与学优化算法.pdf
《一种带有附加记忆策略的改进教与学优化算法.pdf》由会员分享,可在线阅读,更多相关《一种带有附加记忆策略的改进教与学优化算法.pdf(7页珍藏版)》请在咨信网上搜索。
1、收稿日期:2022-11-02摇 摇 摇 摇 摇 摇 修回日期:2023-03-03基金项目:商洛市科研基金项目(2020-Z-0043);商洛学院应用数学科研创新团队项目(19SCX02);大学生创新创业训练计划项目(S202211396052)作者简介:陈怡君(1984-),女,硕士,副研究馆员,研究方向为智能计算及其应用;通讯作者:李会荣(1979-),男,博士,教授,研究方向为智能计算、机器学习等。一种带有附加记忆策略的改进教与学优化算法陈怡君1,任春年2,党妍洁2,李会荣2(1.西安航空学院 图书馆,陕西 西安 710077;2.商洛学院 数学与计算机应用学院,陕西 商洛 72600
2、0)摘摇 要:教与学优化算法是一种模拟班级教学现象的新型群体智能优化算法,算法参数简单,收敛速度快,已经在函数优化、工程计算等领域取得广泛应用。但是算法后期容易陷入局部收敛,为此提出了一种带有附加记忆策略的教与学优化(MTLBO)算法。该算法首先在教学阶段增加教师记忆策略,学生的历史记忆知识与教师历史教学能力对提高班级的整体教学水平具有重要的作用,在每次更新学习者的同时考虑教师上一代的最优值和当代的最优值,有效增强算法局部搜索能力;在学习阶段增加个体向最优个体和随机个体学习策略,多个学生互相学习,充分利用班级内的知识信息,从而增强了算法的全局搜索能力。采用具有不同特征的多个测试函数对算法进行仿
3、真实验,并与基本 TLBO 算法和 2 种改进的TLBO 算法进行对比分析,结果表明提出的 MTLBO 算法在获得较高的收敛精度和稳定性的同时还提高了收敛速度,有效避免算法局部收敛。关键词:教与学优化;智能优化;局部最优;记忆策略;随机学习策略中图分类号:TP301.6摇 摇 摇 摇 摇 摇 文献标识码:A摇 摇 摇 摇 摇 摇 文章编号:1673-629X(2023)09-0208-07doi:10.3969/j.issn.1673-629X.2023.09.031An Improved TLBO Algorithm with Additional Memory StrategyCHEN Y
4、i-jun1,REN Chun-nian2,DANG Yan-jie2,LI Hui-rong2(1.Library,Xi爷an Aeronautical University,Xi爷an 710077,China;2.Department of Mathematics and Computer Application,Shangluo University,Shangluo 726000,China)Abstract:Teaching learning based optimization is a new type of swarm intelligence optimization al
5、gorithm that simulates class teachingphenomena.With simple parameters and fast convergence speed,the algorithm has been widely used in function optimization,engineeringcalculation and other fields.However,the algorithm tends to fall into local convergence later,so the modified teaching learning base
6、d op鄄timization(MTLBO)with additional memory strategy is proposed.The teachers爷 memory strategy is added in the teaching stage and thestudents爷 historical memory knowledge and teachers爷 historical teaching ability play an important role in improving the overall teachinglevel of the class.When updati
7、ng learners each time,the optimal value of the previous generation and the current optimal value ofteachers are considered,effectively enhancing the local search ability of the algorithm.In the learning stage,the individual learningstrategies are added to the optimal individual and random individual
8、,so that multiple students can learn from each other and make full useof the knowledge information in the class,thus enhancing the global search ability of the algorithm.The proposed algorithm is simulatedby multiple test functions with different characteristics,and compared with the basic TLBO algo
9、rithm and two improved TLBOalgorithms.It is showed that the proposed MTLBO algorithm not only achieves higher convergence accuracy and stability,but alsoimproves the convergence speed,effectively avoiding the local convergence of the algorithm.Key words:teaching learning based optimization;intellige
10、nt optimization;local optimum;memory strategy;random learning strategy0摇 引摇 言群体智能优化算法是通过模拟生活中的自然现象或某些动物、植物群体间的竞争、协作进化等行为,实现对优化问题的求解,目前已经受到国内外许多研究者的广泛关注1-6。例如,遗传算法模拟了生物界“适者生存,优胜劣汰冶达尔文进化论观点1;粒子群优化算法模拟鸟类的觅食行为,通过群体中个体之间的协作和信息共享来寻找最优解2;人工蜂群算法模仿蜜第 33 卷摇 第 9 期2023 年 9 月摇 摇 摇 摇 摇 摇 摇 摇 摇 摇计 算 机 技 术 与 发 展COM
11、PUTER TECHNOLOGY AND DEVELOPMENT摇 摇 摇 摇 摇 摇 摇 摇 摇 摇Vol.33摇 No.9Sep.摇 2023蜂的觅食行为3,模拟退火算法模拟物理系统退火过程提出的一种智能算法等等4,这些算法目前已经应用于数据聚类、生物医学、电力优化等多个工业或学术领域2-6。Rao 等人于 2011 年模拟课堂教学过程提出了一种新的优化算法,即教与学的优化(Teaching LearningBased Optimization,TLBO)7。TLBO 工作的基本原理在于教师对学习者在课堂上的输出的影响,学习者的表现是由他学习到的结果或学习成绩来衡量的,教师扮演着知识传授者
12、的角色,经验丰富的老师能够培养出更好的学生。算法可分为教学阶段(TeachingPhase)和学习阶段(Learning Phase)。教学阶段是指向最好的学生学习,学习阶段是指通过互异学习者之间的互动、讨论进行学习,学习者学习的越多,解决方案就越好。该算法具有参数少、易于编程、收敛速度快等优点,已经成功应用于函数优化、机械优化、车间调度、资源分配等实际问题中8-13。例如,Wan 等人将优等生与差等生的区别对待进行分班,认为课堂教学行为是小班级教学并行,优等生在一个班级,差生在一个班级,优等生班级和差生班级是动态流动的14。侯景伟等人认为学生是可以通过课外辅导巩固知识的,每次教师教学表现可能
13、是不一样的,学生每次学习知识的接受程度也是不一样的,借此提出了动态非线性自适应教学因子、课外辅导因子、动态自适应学习因子等随机线性变化的改进 TLBO 算法15。李子扬等人认为教师也可以自学的,将 TLBO 的经典两阶段扩充为教师自学阶段、教学阶段和学习阶段三个阶段,使得教师也在算法每次迭代循环中有改进提升机会,但在提升优化性能的同时引入其他算子,提高了算法的复杂度16。何杰光等人创造性地认为学生在一轮学习阶段并不仅仅向另一个学生学习,也可以在一轮学习阶段向其他多位同学学习,然后再选择与多位同学知识流通的平均值或最大值作为学到的新知识17。此外,王滔等人从学到知识的层面出发,认为当前适应度值大
14、,下次迭代时教学因子就小,当前适应度值小,下次迭代时教学因子就大18,即表明本次教学效果好,下次迭代时教学程度就低些,本次教学效果差,下轮迭代时教学程度就高些,这样可以在一定程度上防止过拟合或早熟。而康佳惠等人将 TLBO 算法与其它群体智能优化算法相结合,利用其它智能优化算法中的优势来提高 TLBO 算法的性能,例如将回溯搜索算法和轮盘赌选择机制引入 TLBO 以提高 TLBO 的全局搜索能力和收敛精度19。文献20引入自适应教学因子和教师的反馈意见对学生学习的影响来提高 TLBO 算法的学习性能。总之,以上 TLBO 算法的改进策略在一定程度上提高了算法的性能,并且已经取得了广泛的应用。但
15、是,以上对 TLBO 改进的算法中几乎没有考虑到知识记忆过程对当前学习的影响,同时历史知识对学习当前知识的启发也很有帮助。为了弥补这一缺陷,基于学习记忆策略,该文提出了一种带有附加记忆策略的教与学优化(MTLBO)算法。该算法在教学阶段增加了一个学习过去知识的记忆过程,同时学习当前知识和历史知识可以提高学习产出;在学习阶段引入了多个学生学习的策略,提高了算法的搜索能力。在多个基准测试函数的实验结果表明,MTLBO 算法在性能上优于其比较算法。1摇 基本教与学优化算法(TLBO)基本 TLBO 算法主要依靠教师对学习者在课堂上输出的影响,不断提高学习者的学习水平。主要分为教学阶段和学习阶段,基本
16、过程如下。1.1 摇 教学阶段在 TLBO 算法中,种群中最优个体被称为“教师冶,其他个体称为“学生冶,通过模拟一个班级中的“教冶和“学冶两种行为,实现对优化问题的求解。假设Xk=x1k,x2k,xDk 为第 k 个学习者(搜索空间中的点),D 为搜索空间的维数,f(Xk)为第 k 个学习者的适应度函数(知识水平),N 为班级总人数(即种群规模)。首先进行种群初始化:Xjk=Xminj+rand(Xmaxj-Xminj)(1)其中,Xminj和 Xmaxj是第 j 维决策变量的上、下界,rand是0,1内的随机数,则教学阶段的更新公式为:newXjk=Xjk+randj伊(Teacherj-T
17、F伊 Xjmean)(2)其中,Teacherj是当前最好学生(即老师)第 j 个维度的决策变量(搜索点),Xjmean=1N移Nk=1Xjk是当前第 j 个维度上班级里的平均知识,newXjk是第 k 个学习者的第 j个维度上的知识水平,randj是0,1范围内的随机生成数。TF是 1 或 2,每轮迭代都重新随机选取,决定着平均知识水平有多大程度被改变。从教师那里得到知识以后,每个学习者均会更新为新的学习者,原始学习者和新生成的学习者间的适应度值低的那个将会被转到下一学习阶段。1.2摇 学习阶段在学习阶段,学习者会通过两两互动交流认识自己的差距,并以此提高自己的知识水平。对于第 k 个学习者
18、 Xk来说,更新机制如下:newXjk=902摇 第 9 期摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 陈怡君等:一种带有附加记忆策略的改进教与学优化算法Xjk+randj伊(Xjk-Xjr),if摇 f(Xk)f(Xr)Xjk+randj伊(Xjr-Xjk),otherwise摇 摇 摇 摇(3)其中,Xr=X1r,X2r,Xjr,XDr 是在班级(种群)中随机选择的互异学习者,r 屹 k,newXjk是学习阶段学习后的第 k 个学习者在第 j 个维度上的知识水平。f(Xk)和 f(Xr)分别是第 k 个学习者 Xk和第 r 个学习者 Xr的适应度值。同样地,在学习阶段所有学生互相学习之后,
19、N 个新的学习者就会生成。新的学习者和教学阶段的学习者中适应度值更小的那些学习者将会被传递到下一轮迭代中的教学阶段。一直重复上述步骤直至达到最大迭代次数或者停止准则时,算法停止,输出最优个体。2摇 一种带有附加记忆策略的改进教与学优化算法(MTLBO)2.1摇 考虑历史知识记忆的教学阶段标准 TLBO 算法是一种基于当前状态改进搜索点的优化算法,并没有考虑到学生的历史记忆知识。一般情况下,学生的历史状态知识对当前状态的学习能力的影响同样重要,能够反映现实班级教学行为,教师会要求学生课后练习,复习所学知识,提高学习能力,同时并预习下一次新课;教师也会根据学生的学习情况动态调整新课教学内容与教学方
20、法,提高班级的整体学习水平。因此学生的历史记忆知识与教师历史教学能力对提高班级的整体教学水平具有重要的作用。所以,在基本的教学优化算法中引入教师历史记忆知识,即在每次更新学习者的同时均要同时考虑教师上一代的最优值和当代的最优值,则第 t 代教师的知识水平更新为:Teacherj(t)=(1-w)Xjbest(t-1)+wXjbest(t)(4)w=(t/T)2摇 摇 摇(5)其中,Teacher(t)是第 t 代的教师,Xbest(t-1)和Xbest(t)为第 t-1 代和第 t 代的最优学生,j 是维度;w为权重因子,决定着教师上一代知识水平对下代学习能力的影响程度。权重 w 越大,教师历
21、史记忆知识对当前的影响越小。2.2摇 改进的学习阶段由式(3)可以看出,标准 TLBO 算法学习阶段主要通过学习者与最优个体之间互动交流而提高自己的知识水平,然而只局限于两个学生之间的互动交流,并没有考虑到班级内最优学生、小组学习、互动学习等学习方式的带动作用。因此,将班级最优学生、随机学习策略引入到学习阶段中,则将学习阶段的迭代方程更新如下:X寅new=琢X寅old+茁(X寅best-X寅old)+(X寅r1-X寅r2)(6)琢=1-(1-t/T)(2 t/T)摇 摇 摇 摇(7)茁=(et/T-1)/(e-1)摇 摇 摇 摇(8)其中,X寅new表示更新后的个体,X寅old是更新前的个体,
22、X寅best是当前班级中的最优学生,X寅r1和 X寅r2是班级内与X寅best和 X寅old互不相同的两个个体,琢、茁 是区间0,1非线性权重因子。与式(3)不同,改进后的式(6)中个体向最优个体学习,并且加入多个学生互相学习,充分利用班级内的知识信息,提高了算法的搜索能力。2.3摇 MTLBO 算法实现流程步骤 1:设置最大迭代次数 Tmax、空间维数 D、种群规模 N,设置当前的迭代次数 t=1,并初始化种群X,计算班级内个体的适应度 f(X)。步骤 2:根据式(2)和式(4)更新教学阶段个体。步骤 3:计算班级内个体的适应度 f(X),并使用贪婪策略更新学生个体。步骤 4:根据式(6)更
23、新学习阶段个体。步骤 5:设置迭代次数 t=t+1,返回到步骤 2,直到 t 达到设定的最大迭代次数 Tmax,输出全局最优值。3摇 结果与分析3.1摇 测试函数为了验证所提 MTLBO 算法的性能,与基本的教学优化算法(TLBO)21、一种多反向学习的教与学优化算法(MOTLBO)17和具有动态自适应学习机制的教与学优化算法(DSLTLBO)22进行对比。选取 6 个标准测试函数进行实验,其中 f1-f5是单峰测试函数,可以测试算法的收敛速度与精度,f6是多峰测试函数,可以测试算法逃出局部最优值的能力。测试函数的表达式、搜索空间信息如表 1 所示。表 1摇 测试函数的性质函数表达式搜索空间F
24、1(X)=移ni=1x2i-100,100F2(X)=移ni=1xi+仪ni=1xi-10,10F3(X)=移ni=1(移ij=ixj)2-100,100F4(X)=maxxi,1 i n-100,100F5(X)=移ni=1ix4i+random0,1)-1.28,1.28F6(X)=-20exp(-0.21n移ni=1x2i)-摇 摇 exp(1n移cos2仔xi)+20+e-32,32012摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 计算机技术与发展摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 第 33 卷摇 摇 实验设置
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 一种 带有 附加 记忆 策略 改进 优化 算法
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,个别因单元格分列造成显示页码不一将协商解决,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【自信****多点】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【自信****多点】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。