基于深度强化学习的轴流式通风机流型优化应用研究.pdf
《基于深度强化学习的轴流式通风机流型优化应用研究.pdf》由会员分享,可在线阅读,更多相关《基于深度强化学习的轴流式通风机流型优化应用研究.pdf(5页珍藏版)》请在咨信网上搜索。
1、Chinese Journal of Turbomachinery第65卷,2023年第3期Http:/turbo- Vol.65,2023,No.3Application Research of Flow Type Optimization Design ofAxial Flow Fan Based on Deep Reinforcement Learning*Yu-kai Hong1Guo-jun Hu2Can-xing Wang1,*(1.School of Aeronautics and Aerospace,Zhejiang University;2.Hangzhou Dunli El
2、ectric Appliance Co.,Ltd.)Abstract:With the intensive study of machine learning methods,its applications are becoming more and more extensive,and itsapplication in fans has also attracted more and more attention.In this paper,deep deterministic policy gradient algorithm is used toestablish a flow ty
3、pe optimization design method for axial flow fan.This method is used to optimize the design of a certain type ofaxial fan,and the aerodynamic performance of the fan before and after the optimization is compared through numerical simulation.The results show that in most working conditions,the fan eff
4、iciency has significantly improved after optimization which indicatesthis method is feasible for the optimal design of axial fan,and it provides a new way for the optimal design of axial flow fan.Keywords:Deep Reinforcement Learning;Deep Deterministic Policy Gradient Algorithm;Axial Fan;Optimal Desi
5、gn;FlowType Design摘要:随着机器学习方法的深入研究,其应用范围越来越广,在风机方面的应用也越来越得到关注。本文采用深度确定性策略梯度算法建立了一种轴流式通风机流型优化设计方法,运用该方法对某轴流式通风机进行优化设计,并通过数值模拟对比优化前后的风机的气动性能。结果表明,在大部分工况下,优化后的风机效率均有明显提升,说明机器学习方法用于轴流式通风机的优化设计是可行的,这为风机的优化设计提供了一种新的途径。关键词:深度强化学习;深度确定性策略梯度算法;轴流式通风机;优化设计;流型设计中图分类号:TH432.1文章编号:1006-8155-(2023)03-0089-05文献标志码
6、:ADOI:10.16492/j.fjjs.2023.03.0015洪煜凯1胡国军2王灿星1,*(1.浙江大学航空航天学院流体工程研究所;2.杭州顿力电器有限公司)基于深度强化学习的轴流式通风机流型优化应用研究*基金项目:国家自然科学基金重点项目(12132015;11872333)*通讯作者:王灿星,0引言作为机器学习的一个新分支,深度强化学习,即将深度学习的感知能力与强化学习的决策能力相结合,能够大大提高算法的求解和泛化能力,使强化学习网络能够更好地感知复杂环境状态,并建立动作策略,同时避免因多维动作空间而导致的维数灾难1。在诸如无人驾驶决策2、投资组合策略3、区域能源系统运行优化4等多个
7、研究领域,深度强化学习的这一特点都得到了良好体现。在气动优化设计中,深度强化学习也得到了应用。李润泽、张宇飞5等人以设计者在翼型气动设计中的增量修型过程为例,给出深度强化学习在气动优化设计中的要素定义和具体算法。温暖、刘正华6等人基于深度强化学习策略研究了一类变体飞行器外形自主优化问题,通过设计深度确定性策略 梯 度 算 法(Deep Deterministic Policy Gradient,简 称DDPG)使飞行器在整个飞行任务过程中达到最优气动外 89Chinese Journal of Turbomachinery形。但在通风机的气动优化研究中还未发现其应用,因此,本文拟研究深度强化学
8、习在轴流式通风优化设计中的应用。叶轮是轴流式通风机最重要的部件,而流型设计则是影响叶轮气动性能的关键一环。邬振耀、程鹏7在文章中指出,变环量流型设计能充分利用叶顶部分的圆周速度,提高叶轮效率,同时减小叶片扭曲,便于叶片的加工制造。金元日、王军、于文文8等人分别对等环量流型和变环量改进型流型进行了内流模拟,分析了流型造成的叶片根部安装角的变化对轴流式通风机性能的影响,结果表明,改进型流型设计能改善根流动,利于气动噪声控制。赵丹丹、赛庆毅9等人采用数值模拟方法对比研究了不同环量指数的轴流式通风机在设计工况下的气动性能,通过分析风机内部流动结构,揭示了沿叶高变环量设计对气动性能影响的控制机理。刘玉成
9、10以变环量指数为优化变量,进行轴流式通风机流型优化设计,发现采用优化流型的风机效率得到提高。除上述采用指数型变环量流型的研究外,不少学者也尝试探索了不同形式变环量流型,如载荷按五次方规律分布11和环量沿径向线性增加12等,均取得了积极进展。因此,本文以轴流式通风机流型为对象,建立了一种基于深度强化学习方法的轴流式通风机优化设计方法,并通过设计实例验证本文优化方法的可行性。1DDPG算法基本理论深度强化学习在强化学习原有决策优势的基础上,又增加了深度学习的感知优势。在深度强化学习中,强化学习作为优化框架,用以定义问题和优化目标,深度学习则利用感知优势来求解策略函数或价值函数,使用反向传播算法来
10、优化目标函数。深度强化学习的一般架构如图1所示。与遗传算法等进化类优化算法不同,深度强化学习结合了深度学习的特征抽象、提取能力和强化学习优秀的决策控制能力,能够很好地适应连续动作空间中非线性优化问题,且具有较好的全局寻优能力,避免陷入局部最优的情况3。DDPG算法是Google在2015年提出的一种融合Actor-Critic算法13的深度强化学习方法14。其特点主要有:1)使用深度卷积神经网络来模拟策略函数和价值函数,更适合于连续的动作空间及非线性模拟函数;2)使用经验回放池Experience Replay Buffer用于状态更新,取消样本之间的相关性,避免神经网络的过拟合;3)在Act
11、or-Critic算法的基础上,引入目标网络和当前网络,使学习过程更加稳定,易于收敛。DDPG算法使用当前网络参数对目标网络参数进行小幅度更新,称为软更新(Soft Update),使算法更稳定,可采用如下方式表示:+()1-QQ+()1-Q(1)式中,为Actor当前网络参数;为Actor目标网络参数;Q为Critic当前网络参数;Q为Critic目标网络参数;为软更新参数,一般取为0.001。图2为DDPG算法的整体框架图,图中的动作网络即Actor-Critic算法中的Actor,而评价网络即Actor-Critic算法中的Critic。Actor当前网络经过噪声处理后生成动作at,环境
12、模型执行at后,生成一组样本()st,at,rt,st+1,其中,st代表t时刻的状态,rt代表t时刻执行动作at获得的奖励,将样本存入经验回放池中,作为训练当前网络的数据集。从经验回放池中随机采样N组数据作为一组小批量样本(mini-batch)训练数据,用以进行当前策略网络和当前Q网络的新一轮参数训练。这是DDPG算法中的外部运行过程,再看当前网络和目标网络的内部运行过程,通过Actor当前网络生成动作at输入Critic当前Q网络中进行评估,得到Q值函数,参与更新Actor当前网络的参数。另一方面,在目标网络中,Actor和Critic目标网络定期通过软更新的方式,用当前网络参数更新自己
13、的网络参数,随后Critic当前网络输出的值函数Q参与Critic中当前网络的目标函数计算,辅助更新Critic当前网络的参数Q,这样就完成了一次DDPG算法的训练过程。2基于DDPG的轴流式通风机流型优化方法2.1轴流式通风机设计基本步骤根据轴流式通风机基本理论对轴流式通风机进行优化前的基本设计,这样能够保证结构参数在合理范围内,从而提高优化设计的效率。文献15详细论述了基于孤立翼型法和平面叶栅法对风机结构参数、气动参数的设计流程。其中,在气动参数设计中,本文采用沿径向呈二次多项式分布的变环量流型,即=ar2+br+c(2)式中,为环量;r为半径;a,b,c为流型控制参数。图1深度强化学习一
14、般架构Fig.1Deep reinforcement learning general architecture图2DDPG算法框架图Fig.2DDPG algorithm framework diagram基于深度强化学习的轴流式通风机流型优化应用研究 90Chinese Journal of Turbomachinery第65卷,2023年第3期Http:/turbo- Vol.65,2023,No.3采用这种变环量流型,能够充分利用叶片中高区域的做功能力,同时避免叶根处出现较大分离,相比于指数型变环量流型也能够更好地避免叶顶处出现较大的叶顶间隙损失。各截面气流周向速度c2u、轴向速度c2
15、a计算公式为c2u=a2r+b2+c2r(3)c2a=c2am2+A1()ri2-rm2+A2()ri-rm+A3()lnri-lnrm+A4()ri-1-rm-10.5(4)式中,A1=2a-a242;A2=2b-2a2-ab42;A3=b2-2ac42;A4=bc42;为叶轮旋转角速度。2.2基于DDPG的轴流式通风机流型优化架构及步骤本文将流型参数进一步简化,定义相对叶高r=rl,r为当前计算半径,l为叶片长度,根据变环量设计方法的特点可以认为环量在相对叶高r=0.75处取得最大值。同时结合全压约束,可以得到流型控制参数b,c关于a的表达式b=-2a()0.75rt+0.25rh(5)式
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 基于 深度 强化 学习 轴流 通风机 优化 应用 研究
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,个别因单元格分列造成显示页码不一将协商解决,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【自信****多点】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【自信****多点】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。