基于深度强化学习和历史轨迹的船舶路径规划.pdf
《基于深度强化学习和历史轨迹的船舶路径规划.pdf》由会员分享,可在线阅读,更多相关《基于深度强化学习和历史轨迹的船舶路径规划.pdf(10页珍藏版)》请在咨信网上搜索。
1、China,2024,4744.(inChinese)OU C K,XIE L,CHA T Q,et al.Ship path planning based on deep reinforcement learning and historical trajectories.Navigationof引用格式:欧昌奎,谢磊,查天奇,基于深度强化学习和历史轨迹的船舶路径规划J1.中国航海,2 0 2 4,47(1):3 6 44.Mar.2024NAVIGATIONOFCHINA2024年3月Vol.47 No.1第47 卷第1期中海国航文章编号:10 0 0-46 53(2 0 2 4)0 1-
2、0 0 36-0 9基于深度强化学习和历史轨迹的船舶路径规划欧昌奎1,2,33,谢磊2,查天奇1.2 3,杨洋1,2.3,胡昕源原1,2,3(1.武汉理工大学智能交通系统研究中心,湖北武汉430 0 6 3;2武汉理工大学国家水运安全工程技术研究中心,湖北武汉430 0 6 3;3武汉理工大学交通与物流工程学院,湖北武汉430 0 6 3)摘要:为减少船舶在航行过程中人为操作不当或者没有及时对障碍风险做出反应而造成的船舶碰撞事故,增加船舶航行的安全性,提出一种船舶路径规划方法。将船舶历史的船舶自动识别系统(AIS)数据进行相应的预处理后,运用K-means聚类算法对相应数据进行聚类,得到的一条
3、特征轨迹,并将其作为船舶在该区域的全局静态路径规划轨迹。设计一种基于深度确定性策略梯度(DDPG)算法的局部路径避碰方法和基于深度强化学习(DQN)的局部路径回归方法,使船舶可对局部动态风险做出有效的反应。分析全局静态路径的效果,并对局部动态路径规划方法做了仿真验证,结果表明:该方法可得到一条较为安全的全局路径,并且可规避航行时的局部动态风险,为船舶安全航行提供一定的参考。关键词:水上交通;路径规划;K-means聚类;深度强化学习中图分类号:U6-9文献标志码:AD0I:10.3969/j.issn.1000-4653.2024.01.005Ship path planning based
4、on deep reinforcement learningand historical trajectoriesOU Changkuil.2.3,XIE Leil-2,CHA TianqilYANG Yang;1,2,31,2,3HU Xinyuan,1,2,3(1.Intelligent Transportation System Research Center,Wuhan University of Technology,Wuhan 430063,China;2.National Engineering Research Center for Water Transport Safety
5、,Wuhan University of Technology,Wuhan 430063,China;3.School of Transportation and Logistics Engineering,Wuhan University of Technology,Wuhan 430063,China)Abstract:A ship path planning method is proposed to reduce ship collisions caused by improper human operations orfailure to react to obstacle risk
6、s in time during navigation,and to increase the safety of ship navigation.After pre-processingthe ships historical AIS data accordingly,the K-means clustering algorithm is applied to cluster the corresponding data anda characteristic trajectory is obtained as the global static path planning trajecto
7、ry of the ship in the area.In addition,a localpath collision avoidance method based on DDPG(Deep Deterministic Policy Gradient)and a local path regression methodbased on DON(Deep Q Network)are designed to enable the ship to respond effectively to dynamic local risks.The effectof the global static pa
8、th is analysed and the local dynamic path planning method is also simulated and validated.The resultsshow that the method can obtain a safer global path and can avoid the local dynamic risks during navigation,providing acertain reference for ships safe navigation of ships.Key words:waterborne transp
9、ort;path planning;K-means clustering;deep reinforcement learning收稿日期:2 0 2 2-10-0 4基金项目:国家重点研发计划(2 0 19YFB1600600;2 0 19YFB16 0 0 6 0 4)作者简介:欧昌奎(1999一),男,硕士生,研究方向为智能交通与安全。E-mail:o u c k w h u t.e d u.c n通信作者:谢磊(197 5一),男,副研究员,博士,研究方向为水路交通信息采集和处理、船舶异常航迹智能识别、船舶路径规划及避碰。E-mail:37欧昌奎,等:基于深度强化学习和历史轨迹的船舶路径
10、规划水路运输因运量大、成本低和通用性强等特点,在交通运输过程中起着不可或缺的作用,我国90%以上的国际贸易和50%以上的国内贸易都是通过水路运输完成。内河运输和海上运输是水上运输的主要方式,其中,内河运输是连接海洋与内陆的纽带,是经贸往来中至关重要的一环2。路径规划技术可有效规避航行风险,快速获得合理路径,指导船舶的安全航行,从而为航运通畅提供技术保障,受到国内外学者的广泛关注。路径规划方法发展至今,已获得众多可行的研究成果,但大多数路径规划方法并不具备与环境交互的能力。强化学习方法以环境观测信息为依据进行动作决策,并以反馈得到的奖励信息对动作行为进行评价,重点关注智能体与环境相互反馈的作用过
11、程,有着良好的环境交互特性3。近年来,强化学习算法在路径规划方法的相关研究中不断发展,并逐步应用至船舶路径规划领域中,着重对该领域中船舶避碰问题展开研究。深度强化学习(DeepQNetwork,D Q N)方法在离散型的动作学习方面受到广泛的专注。ZHANG等4采用DQN方法进行避碰方法设计时,通过考虑国际海上避碰规则(简称规则)对神经网络的权重进行限制,有效加快了避碰模型的训练速度。CHENG等5设计一种基于循环神经的DQN方法,该方法可针对航行目标需求进行船舶避碰路径的选择,并通过仿真试验证明该方法的有效性。深度确定性策略梯度(DeepDeterministic PolicyGradien
12、t,D D PG)算法是基于策略梯度的强化学习方法,其被广泛用于处理连续动作任务。KIM等6 应用DDPG算法,并通过相对位置关系简化状态空间的表示方式,降低任务难度,得到有效的船舶避碰行为决策方法。XU等7 采用DDPG算法进行船舶路径规划方法的研究,也得到了有效的船舶避碰行为决策方法。现有文献中,少有学者利用安全的船舶历史航行数据进行路径规划,因而提出的路径规划方法缺少一定的参考性。为解决船舶静态路径规划时路径搜索慢、安全性低的问题,本文提出一种基于K-means聚类算法的船舶特征轨迹生成方法,该方法利用历史数据生成一条船舶静态路径。同时,为保证实时风险环境下船舶的安全航行,设计一种基于D
13、DPG算法的船舶局部路径避碰方法和一种基于DQN算法的局部路径回归方法。1船舶AIS数据预处理原始船舶自动识别系统(AutomaticIdentifica-tionSystem,A IS)数据存在众多无效数据,无法直接进行船舶航行特征的提取,因此,需对任务水域船舶AIS原始数据集进行预处理操作。本文采用的AIS数据预处理技术框架示意见图1。一AIS动态数据处理1AIS点位信息预处理AIS静态数据处理不同类型船舶重复数据错误数据缺失数据切比雪夫船舶具体不等式位置判断船舶运动异常数据状态判断差值修复一文AIS航迹信息预处理AIS航迹数据处理切比雪夫不等式立航迹完整性判断经预处理的AIS航迹信息数据
14、集图1AIS数据预处理技术框架示意Fig.1Schematic diagram of AIS data preprocessingtechnology framework1.1AIS楼数据点位信息预处理船舶AIS数据包含该船船名、船长、船宽和水上移动通信业务识别码(MaritimeMobileServiceIdentify,M M SI)等静态信息,同时也包含了该船实时经度、纬度、航向和航速等动态信息,搜集包含上述内容的船舶数据,可为任务水域航行特征的提取提供分析基础8 AIS数据发送较为频繁且数据量较大,相关数据缺失是较为常见的问题9。因此,将船舶识别信息缺失的数据视为无效数据并进行删除。但
15、船舶在锚泊状态下和运动状态下的数据信息全部包含在该数据集中,考虑到静止的锚泊船舶对航行特征的分析并无帮助,在进一步的数据筛选过程中,将船速低于1kn的船舶看作锚泊船进行过滤,从而使数据集中仅保留航行状态下的动态AIS数据。对搜集到的数据集以船舶的具体类型进行分类,然后分别确定不同类型船舶正常航速的可信区间。文献10 将长江水域中的船舶分为集装箱货船、非集装箱货船、客船、油船和其他类型船舶等类型。其中,非集装箱货船包含液货船中的化学品船等船舶类型,故而将集装箱货船与去除液货船的非中第47 卷第1期海国航38集装箱货船统归为干货船类,同时,将化学品船与油船归为液货船类。因为,内河船舶航行受到实际情
16、况的限制,航速分布并不遵循某一特定分布1。利用切比雪夫不等式分析船舶航速的置信区间。XP(IX-Xe/e)(1),(0)式(1)中:X为船速样本;X为船速样本期望;X,为船速样本标准差。将式(1)中任意的0替换为k个标准差,则不等式表示为在随机变量均值的基础上,得到k个标准差范围内数据的概率上界。以均值为标准的置信区间可定量地给出船舶船速可信范围的估计界,在均值附近5个标准差的范围内,到该随机变量的概率达到0.96,以该大概率取值区间作为船舶船速的统计标准,对船舶AIS数据进行筛选,保留置信区间内的数据。1.2AIS航迹信息预处理AIS数据集中存在航行信息缺失的问题,因此需确定每条船舶航迹是否
17、完整。统计数据集中船舶AIS数据报文发送时间间隔,利用计算得到的界限值进行航迹数据的筛选。运用切比雪夫不等式统计时间间隔的置信区间,得到最大的可信报文间隔,分析航迹所需包含的最少信息点。统计输人数据集中各船舶AIS数据发送间隔平均值tmean、标准差tstd等,根据切比雪夫不等式得到时间间隔概率置信度达到0.96 的区间值。将航迹起止位置的时间差除以时间间隔最大值,得到该航迹所包含的最少AIS数据点的数量。轨迹点数量低于这个数的航迹,以确保每条船舶轨迹完整。船舶AIS航迹信息筛选流程见图2。1.3船舶AIS数据预处理效果受水域水位、天气等因素的影响,船舶在不同季节会有不同的航行特征,本文选取秋
18、季时间段作为研究对象。本文数据来源于经度区间118 36 .824E,11845.371E】、纬度区间3157 .40 6 N,326.033N范围内,南京段部分通航水域2 0 19年10月14日2 0 19 年11月2 8 日的47 8 8 518 条AIS数据。1)将AIS数据集中的重复数据和缺失数据进行删除。将船速低于1kn的船舶看作锚泊船,并在数据集中剔除。把筛选数据中具体的船舶种类、数量和比例等情况进行汇总,各种类船舶数量及比例统计表见表1。2)将处理得到的数据集中的航速作为随机变量,利用切比雪夫不等式得到不同类型船舶航速置信区间见表2。船舶AIS数据集取某船舶AIS数据按时间排序计
19、算确保航迹完整性的最少值数据NY实际数据量NNN?依次连接AIS数据舍弃该船AIS数据得到航迹信息AIS数据集N为空?Y结束图2船舶AIS航迹信息筛选流程Fig.2Flow chart of AIS track information screening for ship表1各种类船舶数量及比例统计表Tab.1Statistical table of the number and proportionof various types of ships船舶种类干货船客船液货船其他数量/艘3214101350109船型百分比/%85.162.679.272.89表2不同类型船舶航速置信区间Tab.
20、2Confidence interval for speed of differenttypes of ships单位:kn船型散货船液货船客船其他航速置0,13.250,16.800,2 3.410,19.6 4信区间3)舍弃船舶航速置信区间外的AIS数据,删除漂移数据并进行插值处理。统计报文发送时间间隔的置信区间,确定一条航迹信息所需AIS数据点的下限:经统计,点位信息预处理后的数据集中,各船舶AIS数据发送间隔平均值为97.55s,标准差为176.66s,根据切比雪夫不等式得到时间间隔这一随机变量概率是0.96 的区间为0 s,985.12s;再按照图2 完成航迹信息筛选;最后区分其上下
21、行,AIS数据预处理效果图见图3。2船舶路径规划方法2.1船舶静态路径规划本文提出特征轨迹的概念,用于指导船舶静态欧昌奎,等:基于深度强化学习和历史轨迹的船舶路径规划39图3AIS数据预处理效果图Fig.3Rendering of AIS data preprocessing的路径规划。特征轨迹可看作船舶航行的习惯性航线,能有效反映船舶在任务水域的航行特征情况。根据AIS数据中连续3个轨迹点的经纬度L,-1、L,、Lt+1、B,-1、B,、B,+1,计算每个轨迹点的转向角为9;=TT-(L,+1-L,),(B+1-B,)arccosV(L1-L,)2+(B+1-B,)2(L,-L,-1),(B
22、,-B,-1)(2)V(L,-L,-1)?+(B,-B,-1)2将轨迹点的L,、B,与计算得到的,归一化处理,然后将其作为三维K-means聚类模型中的3个因素进行聚类处理。为使轨迹尽可能平滑,需得到更多的轨迹点。因此,可让聚类的簇数尽可能大一些,文中将聚类簇数设置为50。聚类完成后,将聚类中心依次连接成一条轨迹,这条轨迹可作为船舶在此航段航行的特征轨迹,其效果显示见图4。将其他季节的AIS数据代人到此模型中也可得到该时间段内的船舶特征轨迹。恭天大迎特征轨迹历史轨迹图4特征轨迹效果显示Fig.4Characteristic track effect display2.2局部动态路径规划方法2.
23、2.1局部路径避碰算法本文采用基于连续动作的DDPG算法完成船舶局部避碰方法的设计,以完成实时规避障碍风险的任务。DDPG是基于Actor-Critic结构进行工作的,其基本思路是由Actor部分进行直接的动作选择,同时,由Critic部分进行决策的评价,并不断在决策、评价过程中进行训练,以获取完成任务目标的能力。而Actor-Critic结构采用神经网络近似的方式,利用网络拟合能力在连续的动作空间中可高效地进行学习。将其应用于船舶避碰技术可产生更加细致的动作决策,以获得更为有效的船舶避碰效果。基于DDPG的船舶局部避碰方法的目的是保证船舶航行安全,需更为全面、细致地进行船舶周围环境状态信息的
24、感知。船舶可感知一定的相对环境状态,这个感知范围称其为裕量范围。裕量范围需确保船舶在遭遇实时障碍等危害船舶安全航行的情况时,有足够的时间和空间进行规避。裕量范围中的绝对安全范围参照了船舶领域理论。本文借鉴藤井船舶领域模型,其规定非远洋任务水域环境下,若在航船舶船长为L,则船舶领域为长轴为4.0 L、短轴为1.6 0 L的椭圆12。仅考虑船舶承担避碰责任时的障碍规避情况,故而忽略船舶后方的相对环境感知,可进一步简化裕量范围的表达形式。同时,为方便状态信息的确定,将椭圆形的绝对安全范围简化为三角形。为保证船舶航行的绝对安全性,将占据栅格的部分区域进行膨胀处理,以该最小原始栅格的全部覆盖范围作为需进
25、行探测感知的绝对安全范围。在微观栅格环境下,船舶领域范围简化过程见图5。图5舟船舶领域范围简化过程Fig.5Simplified process of ship domain scope使用7 个不同探测方向上船舶与障碍物的距离作为绝对安全范围的输入信息。假设原始栅格边长及船长为1,将船舶看作质点,以其作为起点并以航行方向为基准,分别在0、2 2.5、45、90 方向到达膨胀范围边界的距离作为绝对安全范围距离中第47 卷第1期海国航40d,,并在上述方向进行距离探测,感知各个方向原始栅格的状态信息,由左向右分别记为So、S1、S2、裕量安全范围是在绝对安全范围的探测感知区域的基础上进一步向外扩
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 基于 深度 强化 学习 历史 轨迹 船舶 路径 规划
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,个别因单元格分列造成显示页码不一将协商解决,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【自信****多点】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【自信****多点】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。