基于高阶递归神经网络的AUV鲁棒控制方法.pdf
《基于高阶递归神经网络的AUV鲁棒控制方法.pdf》由会员分享,可在线阅读,更多相关《基于高阶递归神经网络的AUV鲁棒控制方法.pdf(8页珍藏版)》请在咨信网上搜索。
1、第 21 卷 第 2 期 装 备 环 境 工 程 2024 年 2 月 EQUIPMENT ENVIRONMENTAL ENGINEERING 81 收稿日期:2023-10-30;修订日期:2023-12-06 Received:2023-10-30;Revised:2023-12-06 引文格式:李政远,王俊雄.基于高阶递归神经网络的 AUV 鲁棒控制方法J.装备环境工程,2024,21(2):81-88.LI Zhengyuan,WANG Junxiong.A Robust Control Method for AUV Based on High Order Recurrent Neur
2、al NetworksJ.Equipment Environ-mental Engineering,2024,21(2):81-88.*通信作者(Corresponding author)基于高阶递归神经网络的 AUV 鲁棒控制方法 李政远,王俊雄*(上海交通大学 海洋工程国家重点实验室,上海 200240)摘要:目的目的 提出一种基于高阶递归神经网络的 AUV 鲁棒控制方法。方法方法 利用结构简单但逼近效果优越的高阶递归神经网络,对建模不确定性和外部未知干扰进行估计,并将其补偿到输入控制律中,以提高控制性能。之后,基于 HJI 理论和 Lyapunov 稳定性分析导出神经网络权重自适应更新律
3、和 AUV 自适应控制律,设计反步滑模方法作为对比方法,并进行仿真实验。结果结果 设计的基于高阶递归神经网络的 AUV 鲁棒控制方法的跟踪误差、调节时间等控制指标均优于反步滑模方法。设计的鲁棒控制方法可以控制 AUV 精确跟踪目标轨迹,同时具有优秀的控制性能和鲁棒性。结论结论 这一研究为 AUV 轨迹跟踪控制领域提供了一种高效且有效的方法,有望在复杂、不确定的水下环境中得到应用。关键词:自主水下航行器;轨迹跟踪;高阶递归神经网络;HJI 理论;鲁棒控制;Lyapunov 稳定性分析 中图分类号:U674.941;TP242.6 文献标志码:A 文章编号:1672-9242(2024)02-00
4、81-08 DOI:10.7643/issn.1672-9242.2024.02.011 A Robust Control Method for AUV Based on High Order Recurrent Neural Networks LI Zhengyuan,WANG Junxiong*(State Key Laboratory of Ocean Engineering,Shanghai Jiao Tong University,Shanghai 200240,China)ABSTRACT:The modeling uncertainties and external unknow
5、n disturbances,among other factors,impose higher demands on the control methods for Autonomous Underwater Vehicle(AUV)in terms of trajectory tracking.The work aims to propose an AUV robust control method based on high-order recurrent neural networks to address it.High-order recurrent neural networks
6、 with simple structure but superior approximation performance were employed to estimate modeling uncertainties and exter-nal unknown disturbances,which were then compensated for in the input control law to enhance control performance.Subse-quently,the neural network weight adaptive update law and AU
7、V adaptive control law were derived based on the HJI theory and Lyapunov stability analysis.Finally,a backstepping sliding mode method was designed as a comparative approach,and simula-tion experiments were conducted.The experimental results indicated that the proposed AUV robust control method base
8、d on high-order recurrent neural networks outperformed the backstepping sliding mode method in terms of tracking error,settling time,and other control metrics.Simulation experiments demonstrate that the proposed robust control method can effectively fa-cilitate precise target trajectory tracking by
9、AUVs,while simultaneously exhibiting excellent control performance and robust-ness.This research provides an efficient and effective approach for AUV trajectory tracking control,with the potential for appli-cation in complex and uncertain underwater environments.船舶及海洋工程装备 82 装 备 环 境 工 程 2024 年 2 月 K
10、EY WORDS:autonomous underwater vehicles;trajectory tracking;high order recurrent neural network;HJI theory;robust control;Lyapunov stability analysis 世界海洋面积占地球总面积的 2/3,目前人类还只探索了 5%的海洋,水下资源的勘探和开发仍然是海洋科技前沿热点之一。自主水下航行器(Autonomous Underwater Vehicle,AUV)不需要人工实时控制,具有较高的自主性和灵活性,将会是未来水下探索和开发的主要工具。AUV 的轨迹跟踪
11、控制策略是目前的研究热点。由于 AUV 自身参数存在不确定性,且运动伴随强扰动,AUV 的控制策略对精度、可靠性、鲁棒性等有更为严格的需求。传统的非线性控制方法往往基于反步法、滑动模态法等方法。为避免反步法中出现的微分爆炸问题,可采用一阶低通滤波器1-2或命令滤波器3-4替代微分运算。文献2结合反步法和积分滑模控制,提出了多输入多输出励磁直流电机的速度控制策略,可有效控制电机速度稳定在期望速度,然而在应对时变的参考信号时,该方法略有不足。文献3使用命令滤波器以避免微分爆炸,同时结合观测器观测海流扰动,将其补偿到控制律中,然而该方法未考虑建模不确定性以及未知扰动。为避免滑模控制方法中出现的抖振现
12、象,可采用线性饱和函数或非线性饱和函数5-6替代符号函数或高阶滑模控制7-9等方法抑制抖振。文献6结合传统的非奇异终端滑模控制和输入饱和函数,提出了具有输入饱和的非线性二阶系统的非奇异终端滑模控制器,并证明了在该控制律下,闭环系统的状态可以在有限时间内收敛到 0,然而该控制律依赖于不确定性有界且界限已知。文献9提出了一种对数滑模控制,利用自然对数函数替代符号函数以加快滑动阶段的收敛速度,并在此基础上构造了基于超扭曲算法的对数滑模流形,以减少稳定阶段的抖振。另外,H鲁棒控制策略近年来也备受关注,但在非线性系统中,H控制器鲁棒稳定时的条件往往为非线性不等式条件(NLMI),求解较为困难。文献10针
13、对无人船的转艏运动控制律,将 H控制器系统稳定的 NLMI 解耦并转化为多项式条件(PLMI),并使用平方和方法求解得到控制律。该方法可有效抑制外部扰动项,有较强鲁棒性,然而对于解耦困难甚至无法解耦的系统,该方法存在较大的局限性。文献11使用 H控制器解决车辆转向时的非线性和执行器饱和问题时,将非线性矩阵不等式线性化,转化为线性矩阵不等式的凸优化问题,但是存在状态维数增加时,控制输出趋于保守的问题。文献12则针对 AUV垂直面轨迹跟踪使用 H控制策略,并基于泰勒展开求解 HJI 不等式,具有较强的抗扰动能力。此外,随着深度学习的兴起,越来越多的神经网络模型也被应用到 AUV 控制策略中,以提高
14、控制性能。基于神经 网络的 AUV 控制策略多为在线学习,由于神经网络的“万能逼近”特性,神经网络可用于 PID 控制策略的参数整定13-15、模型不确定项逼近16-19和无模型的强化学习控制策略20-22。文献16将动态模糊神经网络用于补偿系统的不确定性,使用高斯函数作为隐藏层的激活函数,并结合观测器得到神经网络输出误差,基于反向传播给出权重更新律,最后将神经网络的输出补偿到基于反步法的控制律中,具备较好的自适应能力。文献18使用 RBF 神经网络估计 AUV 的未知非线性函数,并补偿到滑模控制器中,保证 AUV可以准确跟踪目标轨迹。然而,广泛使用的 RBF 神经网络或高斯隶属函数的精度依赖
15、于高斯函数的宽度和中心点的选取,当宽度或中心点选取不恰当时,逼近效果将无法保证。此外,当神经网络需要逼近复杂非线性系统时,往往需要增加神经元数量和网络深度,模型结构复杂度和在线更新计算时间都大幅增加。最后,使用基于损失函数和反向传播的参数更新方法无法证明系统在 Lyapunov 意义下的稳定性。为解决 AUV 建模参数不确定性和外部干扰等未知因素的影响,本研究提出了一种基于高阶递归神经网络的 AUV 鲁棒控制策略。此策略旨在利用神经网络的逼近能力来整体逼近系统的干扰项,并将其嵌入到控制策略中,以提高 AUV 的鲁棒性。为避免使用RBF 神经网络或高斯函数时的参数选取问题和降低计算复杂度,采用了
16、结构简单但逼近性能出色,且不依赖参数选取的高阶递归神经网络。控制策略的设计基于 HJI 理论和 Lyapunov 稳定性分析,从而导出了自适应控制律和权重自适应更新律。这些理论基础确保了控制策略的稳定性和鲁棒性,使 AUV 能够有效地对抗未知的干扰因素。此外,为了进行性能对比,还设计了一种反步滑模控制方法,作为传统方法的代表。通过仿真实验,对比了基于高阶递归神经网络的AUV 鲁棒控制方法与反步滑模 AUV 控制方法。结果表明,设计的 2 种方法都能有效地抵抗 AUV 的未知干扰项,具有强大的鲁棒性,尤其是基于高阶递归神经网络的 AUV 鲁棒控制方法,在稳态误差和调节时间等控制性能指标上均优于传
17、统的反步滑模控制方法。这些仿真实验结果验证了基于高阶递归神经网络的 AUV 鲁棒控制方法的出色控制性能,为 AUV 轨迹跟踪控制领域的进一步研究提供了重要的理论和实验依据。1 AUV 运动学-动力学模型 本文以一类全驱动 AUV 作为研究对象,为便于第 21 卷 第 2 期 李政远,等:基于高阶递归神经网络的 AUV 鲁棒控制方法 83 描述 AUV 的运动状态,定义全局的大地坐标系 O-xyz和随动的机器人坐标系 Oo-xoyozo,如图 1 所示。图 1 AUV 坐标系 Fig.1 AUV coordinate system AUV 在大地坐标系中位姿为T,x y z ,在机器人坐标系中,
18、速度与角速度为T,u v w p q rv,则可将 AUV 运动学-动力学模型表示为23:JvMvC v vD v vgd(1)式中:J()为大地坐标系到机器人坐标系的坐标转换矩阵;M 为惯性矩阵,M=M0+M;C(v)为科里奥利向心力矩阵,C(v)=C0(v)+C;D(v)为阻尼矩阵,D(v)=D0(v)+D;g()为恢复力和力矩,g()=g0()+g;T,uvwpqr 为各个自由度推进器的控制输入;T,uvwpqrddddddd为外界扰动项;M、C、D、g 为模型的不确定项。将模型不确定项和外界扰动项统一为系统的干扰项all dMvCD vgd,将式(1)改写为如下形式:dTMCDg (2
19、)其中:T10T1100T10T0TallTdTMJM JCJCvM JJ JDJDvJgJgJdJ(3)定理 1:矩阵2MC为一斜对称矩阵。证明如下:T10T110T10222222vCJMJCJM JJJCJCJM(4)考虑到水下机器人的斜对称特性,C0(v)为斜对称矩阵,故2MC为斜对称矩阵。2 运动控制器设计 2.1 基于高阶递归神经网络的鲁棒控制器 2.1.1 高阶递归神经网络 为获取模型中的不确定项d,并将其补偿到控制律中,采用高阶递归升级网络对不确定项进行逼近。高阶递归升级网络24(Higher-Order Recurrent Neural Network,HORNN)在 Pi-
20、Sigma 神经网络的基础上,增加了 2 个内环递归项,以提高网络的时间序列识别能力。相较于较为流行的循环神经网络如对角递归神经网络(Diagonal Recurrent Neural Network,DRNN)、约旦递归神经网络(Jordan Recurrent Neural Network,JRNN)等,在降低模型的整体结构复杂度(隐藏层神经元为 3 个)的同时,具有更好的自适应逼近能力。高阶递归神经网络的结构如图 2 所示。图 2 中各个权重分别为:111213212223313233121221223132121221223132,;,;,;,;,;,;,ffffffffffiiiii
21、iiiiiiiiioowwwwwwwwwwwwwwwwwwwwwwWWWW(4)以上权重矩阵需要自适应更新,其中(mjw),f i o q表示权重W中第 m 个输入到第 j 个输出的权重;f()为线性或非线性激活函数。本文设计网络结构为 2-3-1,定义期望轨迹 d和AUV 跟踪误差de ,神经网络输入为;xe e,输入输出均为 6 维向量。则隐藏层的第j个神经元的输出为:32111fiqjmj mmjmjmmskw skw xkwk(5)神经网络的输出:311jojy kfskw y k(6)则HORNN的输出可表示为:,dfiqohWW W W (7)式中:Wf、Wi、Wq、Wo表示理论最
22、优权值;为逼近误差。神经网络实际输出为:,fiqdohWWWW (8)式中:fW、iW、qW、oW为最优权值的估计值。为便于控制器设计,将,fiqohhWW W W在点,fiqoWWWW处进行泰勒展开:,Df i o qhWh (9)84 装 备 环 境 工 程 2024 年 2 月 图 2 HORNN 结构 Fig.2 Structure of HORNN 式中:,fiqohhWWWW、WWW,f i o q、为权重对应的偏导矩阵;D为泰勒展开的高阶项。其中各个权重关于输出的偏导数使用链式法可得:31313111onqnjnjnmfnmjnjnminmjnjy kfy kwky kfskwk
23、y kfskskwky kfskxkwk (10)2.1.2 控制律与权重自适应更新律 定义如下的1x和滑模函数2x:12xexece(11)式中:c 为正定矩阵。对 x1、x2求导,根据式(2)、式(7)和式(9),可得到式(12)。12121 22,Tf i o qd hWxxcxM xxM(12)式中:1CD,2111dcxgM ce ,D。则系统的反馈控制律与权重自适应更新律为:2222T21122 ,dTf i o q MxxhKxW(13)式中:K为正定对角矩阵;为自定义控制参数,0。式(13)基于Lyaponuv稳定性与HJI定理导出,推导过程见后文的稳定性分析。在每个控制时间步
24、中,神经网络各个权重的导数根据系统状态x2进行自适应更新,之后通过积分更新神经网络的各个权重。接下来基于更新后的权重,计算神经网络的输出,并将其输入到控制律中,提高系统的鲁棒性。基于高阶递归神经网络的AUV鲁棒控制方法的结构如图3所示。图 3 结构框图 Fig.3 Structural block diagram 2.2 基于反步法的滑模控制器 反步法和滑模法鲁棒性强,控制性能优异,是广第 21 卷 第 2 期 李政远,等:基于高阶递归神经网络的 AUV 鲁棒控制方法 85 泛应用于AUV的控制方法。本文结合反步法与滑模法设计了一种控制性能优秀的反步滑模控制器作为基于高阶递归神经网络的鲁棒控制
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 基于 递归 神经网络 AUV 鲁棒控制 方法
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【自信****多点】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【自信****多点】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。