神经网络结构搜索方法综述_刘建伟.pdf
《神经网络结构搜索方法综述_刘建伟.pdf》由会员分享,可在线阅读,更多相关《神经网络结构搜索方法综述_刘建伟.pdf(20页珍藏版)》请在咨信网上搜索。
1、如今,深度学习广泛地应用于生活、工作中的各个方面,给我们带来了极大的便利.在此背景下,需要设计针对不同任务的神经网络结构,满足不同的需求.但是,人工设计神经网络结构需要专业的知识,进行大量的实验.因此,神经网络结构搜索算法的研究显得极为重要.神经网络结构搜索(NAS)是自动深度学习(AutoDL)过程中的一个基本步骤,对深度学习的发展与应用有着重要的影响.早期,一些神经网络结构搜索算法虽然搜索到了性能优越的神经网络结构,但是需要大量的计算资源且搜索效率低下.因此,研究人员探索了多种设计神经网络结构的算法,也提出了许多减少计算资源、提高搜索效率的方法.本文首先简要介绍了神经网络结构的搜索空间,其
2、次对神经网络结构搜索算法进行了全面的分类汇总、分析,主要包括随机搜索算法、进化算法、强化学习、基于梯度下降的方法、基于顺序模型的优化算法,再其次探索并总结了提高神经网络结构搜索效率的方法,最后探讨了目前神经网络结构搜索工作中存在的问题以及未来的研究方向.关键词:神经网络结构搜索;搜索空间;搜索策略;性能评估策略引用格式:刘建伟,王新坦.神经网络结构搜索方法综述.控制理论与应用,2023,40(1):12 31DOI:10.7641/CTA.2022.10568A review of neural network structure search methodLIU Jian-wei,WANG
3、Xin-tan(Department of Automation,China University of Petroleum,Beijing 102249,China)Abstract:Nowadays,deep learning is widely used in all aspects of life and work,which brings us great convenience.In this context,we need to design neural network structure for different tasks to meet different needs.
4、However,manuallydesign of neural network structure needs professional knowledge and a lot of experiments.Therefore,the research ofneural network structure search algorithm is very important.Neural network structure search(NAS)is a basic step in theprocess of automatic deep learning(AutoDL),which has
5、 an important impact on the development and application of deeplearning.In the early stage,although some neural network structure search algorithms have found excellent neural networkstructure,they need a lot of computing resources and search efficiency is low.Therefore,researchers have explored ava
6、riety of neural network structure design algorithms,and also proposed many methods to reduce computing resources andimprove search efficiency.Firstly,we briefly introduce the search space of neural network structure.Secondly,we make acomprehensiveclassification,summaryandanalysisofneuralnetworkstruc
7、turesearchalgorithms,includingrandomsearchalgorithm,evolutionaryalgorithm,reinforcementlearning,gradientdescentbasedmethodandoptimizationalgorithmbasedon sequential model.Thirdly,we explore and summarize methods to improve the efficiency of neural network structuresearch.Finally,we discuss the probl
8、ems existing in the current neural network structure search work and the future researchdirection.Key words:neural network structure search;search space;search strategy;performance evaluation strategyCitation:LIU Jianwei,WANG Xintan.A review of neural network structure search method.Control Theory&a
9、mp;Appli-cations,22023,40(1):12 311引引引言言言1.1神神神经经经网网网络络络结结结构构构搜搜搜索索索的的的研研研究究究背背背景景景近年来,深度学习在图像分类、图像语义分割、物体识别、语音识别、机器翻译等方面取得了显著的进步,其中的神经网络模型结构大部分是由人工设计的,例如应用于图像分类的AlexNet1,VGGNet2,Goog-LeNet3,ResNet4,ResNeXt5等经典网络结构均由人工设计.然而,人工设计神经网络结构需要专业的收稿日期:20210630;录用日期:20220301.刘建伟.E-mail:;Tel.:+86 13699114280.
10、本文责任编委:徐昕.中国石油大学(北京)科研基金项目(2462020YXZZ023)资助.Supported by the Science Foundation of China University of Petroleum,Beijing(2462020YXZZ023).第 1 期刘建伟等:神经网络结构搜索方法综述13知识背景,这严重阻碍了深度学习的发展与应用.由此,凸显了研究神经网络结构搜索算法的重要性.1.2神神神经经经网网网络络络结结结构构构搜搜搜索索索的的的研研研究究究进进进展展展从上世纪80年代,人们就开始了对神经网络结构的探索.进化算法是早期搜索神经网络结构的主要方法,其优化目
11、标单一,均为模型的正确率.近期,伴随着人工智能的热潮,深度学习的研究日益成为热点,同时深度学习的应用领域更加广阔,深度学习在自然语言处理、计算机视觉、自动驾驶、推荐系统等方面均取得了显著的成果.在这些任务中,所使用的神经网络主要是卷积神经网络、循环神经网络.在此背景下,神经网络结构的设计变得更加重要.目前的研究工作主要集中于卷积神经网络结构的搜索.2016年,Zoph等人6提出基于强化学习的神经网络结构搜索算法,在CIFAR10数据集上的实验结果表明,该算法设计的结构在性能上超越了人工设计的ResNet4、FractalNet7等经典结构.但是,该算法需要消耗大量的计算资源.这引起了人们对神经
12、网络结构搜索工作的极大关注.因此,许多研究人员对之前的神经网络结构搜索算法进行了改进,探索并提出了多种新颖的神经网络结构搜索算法,以及减少计算资源、提高搜索效率的方法.神经网络结构搜索算法主要包括3个方面的工作8:搜索空间、搜索策略、性能评估策略.近几年,神经网络结构搜索在搜索空间、搜索策略、性能评估策略等方面均取得了创新性的成果,也具有十分重要的意义.搜索空间的形式与神经网络结构的形式密切相关,同时在一定程度上也决定了神经网络结构的性能.我们将搜索空间分为整体形式的神经网络结构空间、单元组合形式的神经网络结构空间、层次形式的神经网络结构空间.神经网络结构的搜索策略是本文的重点研究内容.我们对
13、目前主流的神经网络结构搜索策略进行了分类汇总,主要有随机搜索算法、进化算法、基于强化学习的方法、基于梯度下降的方法、基于顺序模型的优化算法.性能评估策略是神经网络结构搜索算法中必不可少的一部分.在所有的搜索算法中,都需要对搜索到的模型结构进行评估.最简单的性能评估策略是:首先,在训练集上重新训练候选的神经网络结构模型;其次,在测试集上评估训练后的模型.但是此方法的效率比较低.性能评估策略在一定程度上决定了神经网络结构的搜索效率.如何提高神经网络结构搜索效率也是本文的重点研究内容.目前主要有3种提高神经网络结构搜索效率的方法:改进神经网络结构搜索算法的搜索空间、间接评估模型的性能、减少模型的训练
14、代价.最简单的方法是改进神经网络结构搜索算法的搜索空间.在单元组合形式的搜索空间中首先搜索单元的结构,其次按照提前确定的方式堆叠起来.此方法简化了搜索空间,降低了搜索的复杂性,提高了搜索效率.后两种方法都是在性能评估阶段发挥作用.间接评估模型的性能:使用替代函数模型912预测神经网络模型的正确率,避免了评估模型性能时对模型的训练.减少模型的训练代价:使用权重共享10,1314、网络态射15等方法避免了重新训练模型,使用早期停止模型训练1618的方法减少了模型的训练次数.我们将本文与现有的一些关于神经网络结构搜索的综述进行了对比.Elsken等人8、Hu等人19、Wis-tuba等人20、He等
15、人21的工作虽然对现有的神经网络结构搜索算法进行了的分类总结,但是没有对类内、类间的不同算法进行对比分析.在Ren等人22的综述中以时间顺序为准线,总结了早期神经网络结构搜索工作中的问题,以及后来的解决方法.但是,在Ren等人22的综述中主要总结了基于梯度下降的方法,缺乏对其他搜索算法的总结.本文对神经网络结构搜索算法进行了全面的分类汇总,仔细分析了每类方法的特点、每类方法在研究过程中的改进之处.同时,我们不仅对比分析了同一类算法,而且也简要对比分析了不同类算法.另外,我们对提高神经网络搜索效率的方法进行了全面的汇总及分析.1.3本本本文文文的的的结结结构构构安安安排排排本文对神经网络结构搜索
16、算法中的搜索空间、搜索策略、提高神经网络结构搜索效率的方法(包含性能评估)进行了全面总结.第2节简要介绍了神经网络结构搜索算法中的搜索空间,主要包括整体形式的神经网络结构空间、单元(cell)组合形式的神经网络结构空间、层次形式的神经网络结构空间.第3节介绍了神经网络结构搜索算法中的搜索策略,主要包括随机搜索算法、基于梯度下降的方法、进化算法、强化学习、基于顺序模型的优化算法等.第4节总结了提高神经网络结构搜索效率的方法.第5节简要介绍了神经网络结构搜索算法现阶段中存在的问题以及将来的发展方向.第6节对本文的工作进行了总结.2搜搜搜索索索空空空间间间如表1所示,神经网络结构的搜索空间有3种常见
17、的形式.第1种为整体形式的神经网络结构空间,包括直连和多分支两种形式;第2 种为单元(cell)组合形式的神经网络结构空间;第3种为层次形式的神经网络结构空间.14控 制 理 论 与 应 用第 40 卷表 1 神经网络结构的搜索空间Table 1 Search space of neural network structure搜索空间形式神经网络结构整体形式NAS6,MetaQNN23,Genetic CNN24,NSGANET25,EvoNAS26等单元组合形式NASNet27,BlockQNN28,MnasNet29,DARTS30,NAONet31等层次形式Hierarchical re
18、presentation evolution32,AutoDeepLab33等2.1整整整体体体形形形式式式的的的神神神经经经网网网络络络结结结构构构空空空间间间2.1.1直直直连连连形形形式式式的的的神神神经经经网网网络络络结结结构构构如图1所示,直连形式的神经网络结构是较为简单的一种结构.图1 中第2层的输入为第1层输出,第2层的输出为第3层输入.当搜索直连形式的卷积神经网络结构时,需要确定神经网络的层数、神经网络每一层的操作类型(例如,池化、卷积操作等)、超参数(例如,池化大小及步幅等).在直连形式的神经网络结构搜索空间中,搜索到的典型结构有NAS6、Meta-QNN23等.图 1 直连
19、形式的神经网络结构Fig.1 Directly connected neural network architecture2.1.2多多多分分分支支支形形形式式式的的的神神神经经经网网网络络络结结结构构构如图2多分支形式的神经网络结构的示意图所示,第4层的输入为第2层和第3层的输出,第4层的输出为第5层的一个输入.在多分支形式的神经网络结构搜索空间中,搜索到的典型结构有Genetic CNN24、NSGANET25、Evo-NAS26等.可以看出,在多分支形式的神经网络结构中最明显的特点是使用了跳连,即不相邻的两个层直接相连,例如第2层与第4层之间的连接边.Sun等人34在理论和实验上证明了跳
20、连(skip connection)的优越性,使用跳连可以在一定程度上避免深度神经网络训练过程中存在的梯度消失问题.2.1.3小小小结结结与与与分分分析析析整体形式的神经网络结构空间包含直连、多分支两种形式的神经网络结构.整体形式的神经网络结构空间的一个显著特点是搜索范围大.因此,在整体形式的神经网络结构空间上可以搜索到更适合相应任务的神经网络结构.但是,大范围的搜索空间,会降低搜索效率.多分支形式的神经网络结构与直连形式的神经网络结构相比,多分支形式的神经网络结构更复杂,表达能力更强.图 2 多分支形式的神经网络结构Fig.2 Multi-branch neural network arch
21、itecture2.2单单单元元元组组组合合合形形形式式式的的的神神神经经经网网网络络络结结结构构构为了提高神经网络结构的搜索效率和迁移特性35(在某一数据集上搜索到的单元结构应用在其他数据集上),研究人员提出了单元组合形式神经网络结构.单元组合形式神经网络结构的显著特点是搜索空间的范围较小、单元结构也较小.这是单元组合形式的神经网络结构具备高搜索效率和迁移特性的根本原因.如图3所示,该单元组合形式的神经网络结构由两种单元组成.在单元组合形式的神经网络结构中,单元内部的网络结构依据搜索策略搜索得到,单元外部的连接方式根据经验和实验结果确定.例如,在NAS-NET27形式的网络结构中,按照一定的
22、连接方式将搜索到的标准单元和约简单元组合起来.在正则进化算法36、JASQ算法37等许多神经网络结构搜索算法中也使用了NASNET 形式的网络结构.在单元组合形式的神经网络结构搜索空间中,搜索到的典型结构有BlockQNN28、MnasNet29、DARTS30、NAONet31等.Shu等人38的工作表明现有的神经网络结构搜索算法倾向于选择较宽、较浅的单元结构.单元组合形式的神经网络结构不仅简化了搜索空间,降低了搜索的复杂性,而且具有一定的迁移特第 1 期刘建伟等:神经网络结构搜索方法综述15性35,提高了神经网络结构的搜索效率.但是,单元组合形式的神经网络结构有一个潜在的缺点:限制了搜索空
23、间的大小,从而在一定程度上限制了神经网络结构的探索.图 3 单元组合形式的神经网络结构Fig.3 Cell-based neural network architecture2.3层层层次次次形形形式式式的的的神神神经经经网网网络络络结结结构构构Liu等人32提出图4所示方法来构建不同层次的单元结构,在该基于层次表示的神经网络结构中,最低层次单元是一系列基本的操作,例如不同的卷积、池化操作,高层次单元用低层次单元来构建:O(2)1=assemble(G(2)1,O(1),(1)O(1)=O(1)1,O(1)2,O(1)3.(2)图 4 一个含有两层次的神经网络结构Fig.4 An exampl
24、e of a two-level hierarchical archi-tecture representation在图4中,如式(1)所示,依据连接矩阵G(2)1,用第1层次中的O(1)=O(1)1,O(1)2,O(1)3单元构成第2层次的第1个单元O(2)1.(G(2)1,O(l)是用层次表示法定义的图4所示的神经网络结构.一般的,用层次表示法定义的一个神经网络结构可以表示为(G(l)mMix=2Ll=2,O(1),其中:G(l)m表示l层次中第m个单元的连接矩阵,Ml表示l层次的网络结构中包含Ml个单元,L表示网络结构的最高层次.Liu等人32所提出的层次形式的神经网络结构,可以看做是单
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 神经网络 结构 搜索 方法 综述 刘建伟
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,个别因单元格分列造成显示页码不一将协商解决,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【自信****多点】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【自信****多点】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。