基于选址机制与深度强化学习的WRSN移动能量补充.pdf
《基于选址机制与深度强化学习的WRSN移动能量补充.pdf》由会员分享,可在线阅读,更多相关《基于选址机制与深度强化学习的WRSN移动能量补充.pdf(7页珍藏版)》请在咨信网上搜索。
1、现代电子技术Modern Electronics Technique2023年11月1日第46卷第21期Nov.2023Vol.46 No.210 引 言无 线 可 充 电 传 感 器 网 络(Wireless Rechargeable Sensor Network,WRSN)1通 过 配 备 可 移 动 充 电 装 置(Mobile Charger,MC)能从根本上解决传感器能量受限的问题,被广泛应用于战场监测2、生态系统监测34、交通监测5等信息感知领域,具有传感器节点密集且分布范围广泛的特点。一对多能量补充技术通过适当调整发送器和接收器线圈的工作频率6,MC 可以同时为多个传感器充电,从
2、而有效提高能量传输效率,更能适应规模较大、节点数目众多WRSN的应用场景。在 WRSN 一对多充电方案中 MC 充电驻点的选取基于选址机制与深度强化学习的WRSN移动能量补充王 倩1,2(1.昆明理工大学 信息工程与自动化学院,云南 昆明 650500;2.昆明理工大学 云南省计算机技术应用重点实验室,云南 昆明 650500)摘 要:无线充电已成为彻底解决无线传感器网络能量受限问题最有前景的技术之一。针对传感器网络应用场景中的高能量补充需求,提出一种基于选址机制与深度强化学习的一对多充电策略MSRL,利用带权集合覆盖问题求解移动充电装置(MC)的近似最优充电驻点集;基于Dueling DQN
3、算法,综合考虑传感器的能量消耗率、地理位置、剩余能量等因素确定MC访问充电驻点的顺序。通过捕捉充电动作在时间序列中的关系,使用奖励反馈评估充电决策的质量,自适应调整充电路径,实现 MC充电调度的优化。进一步对 Dueling DQN算法进行改进,利用 Gradient Bandit策略提高奖励值高的样本被采样的概率,加快算法训练速度。大量仿真实验结果表明,MSRL策略不仅可以显著减少传感器节点的死亡数和网络平均能量消耗,延长网络的生存时间,并且优于其他比较方法。关键词:无线可充电传感器网络;一对多能量补充方案;深度强化学习;选址机制;带权集合覆盖;奖励反馈中图分类号:TN71134;TP393
4、 文献标识码:A 文章编号:1004373X(2023)21008207Mobile energy replenishment based on location mechanism and deep reinforcement learning for WRSNWANG Qian1,2(1.Faculty of Information Engineering and Automation,Kunming University of Science and Technology,Kunming 650500,China;2.Yunnan Key Laboratory of Computer T
5、echnologies Application,Kunming University of Science and Technology,Kunming 650500,China)Abstract:Wireless charging has become one of the most promising technologies to completely solve the problem of energy limitation in wireless sensor networks.In this paper,a onetomany charging strategy based on
6、 location mechanism and deep reinforcement learning(MSRL)is proposed to meet the high energy supplement requirements in sensor network application scenarios.The approximate optimal charging stagnation point set of the mobile charger(MC)is solved by the weighted set coverage problem.On the basis of d
7、ueling DQN(deep Qnetwork)algorithm,the sequence of MC visiting charging stagnation point is determined by comprehensively considering the energy consumption rate,geographical location,residual energy and other factors of sensors.MC charging scheduling is optimized by capturing the relationship betwe
8、en charging actions in time series,using reward feedback to evaluate the quality of charging decision,and adaptively adjusting the charging path.In this paper,the dueling DQN algorithm is further improved by using the gradient bandit strategy to improve the sampling probability of samples with high
9、reward values and speed up the algorithm training.The results of a large number of simulation experiments show that the MSRL strategy can not only significantly reduce the deaths of sensor nodes and the average energy consumption of the network,but also prolong the network lifetime.Therefore,the pro
10、posed MSRL strategy outperforms the comparison methods.Keywords:wireless rechargeable sensor network(WRSN);onetomany energy supplement scheme;deep reinforcement learning;site selection mechanism;weighted set coverage problem;reward feedbackDOI:10.16652/j.issn.1004373x.2023.21.016引用格式:王倩.基于选址机制与深度强化学
11、习的WRSN移动能量补充J.现代电子技术,2023,46(21):8288.收稿日期:20230322 修回日期:202304188282第21期以及充电路径的规划是实现高效能量补充的两个关键因素,目前大多数相关研究将其构造为组合优化问题。文献7将一对多充电问题归约成覆盖TSP问题,首先采用PSO算法得到 MC充电驻点,然后采用 LKH算法构造遍历这些驻点的最小 TSP 回路。文献8提出一种基于加权启发式的充电策略 GOCS,计算出充电优先级,抢占式按需充电。随着机器学习的发展,文献9引入时间窗的概念表示充电需求,基于传感器的时间窗信息和能量信息,将 DQN 引入用于确定 MC 的充电路径。可
12、以看到,将机器学习与充电策略相结合有利于提高 MC的自主性,实时响应充电请求。由于同时考虑组合优化问题的解空间复杂度过大,本文将能量补充问题离散化为驻点选取和路径规划两个子问题进行求解。针对上述问题,本文提出一种基于选址机制与深度强化学习的一对多充电策略(Onetomany Charging Strategy Based on Reinforcement Learning,MSRL)。本文采用预先设置驻点的方式对传感器节点进行能量分批管理,实现网络的全覆盖。首先将充电驻点选取问题抽象为选址问题中的集合覆盖问题,通过WSC_RA10算法求解出最优充电驻点集。在确定驻点位置后,引入充电奖励,基于
13、Dueling DQN 得到充电调度的最优策略,实时动态提供充电方案,延长 WRSN网络寿命。1 网络模型与问题描述1.1 网络模型本文的网络模型如图1所示,在网络覆盖区域随机部署N个传感器节点V=v1,v2,vn,vi代表第i个传感器节点,节点具有监控自身剩余能量、数据融合的能力;基站位置固定位于网络中心,为 MC供应能量且能量不受限。当传感器剩余能量低于充电阈值时,传感器节点会通过多跳通信的方式向基站发送充电请求,基站再将充电请求转发给 MC。MC为带有高容量无线充电电源的移动设备,具有强大的计算能力和足够的服务池来接收充电请求,当收到充电请求后沿着充电路径访问充电驻点P=p1,p2,pm
14、,并为覆盖范围内的传感器节点以一对多的方式充电。因此根据模型假设和相关定义,在表1中列出了主要的参数符号,此外还进一步给出了充电驻点的定义。定义 1:充电驻点即 MC预设停靠位置。MC在网络中停靠时才对传感器进行充电行为。1.2 问题描述WRSN可持续稳定工作对确保监控质量至关重要,为了衡量 MC 的充电性能,将一次充电周期结束后,网络中所有传感器节点的平均剩余能量定义为网络平均剩余能量,如式(1)所示:-RE=1Ni=1Nrei(1)图1 网络模型表1 主要参数符号名称NemaxreiceiEthPtCrvc描述传感器数量传感器节点电池容量第i个传感器节点实时电量第i个传感器节点能量消耗率充
15、电阈值MC充电功率MC充电半径MC移动速度MC运动单位距离能耗与此同时,传感器节点失效时无法保证网络的连通性,会产生数据丢失、网络断开等问题11,如何最小化节点失效数,是充电方案中要解决的关键问题。因此,本文引入传感器节点死亡数DN作为衡量充电方案性能的主要指标之一,并且假设t时刻 MC剩余电量为Et,此时距离基站距离为dt。表述受限的组合优化问题为:min DNmin-REEt cdt,t T(2)式中:Et cdt表示限制 MC 在移动过程中任意时刻的电量,可以保证其返回基站。2 MSRL策略设计与实现2.1 确定候选充电驻点集以优化 MC 移动距离为目标,为 MC 确定合适的充电驻点位置
16、,实现全覆盖的同时充电驻点数最少。确定王 倩:基于选址机制与深度强化学习的WRSN移动能量补充83现代电子技术2023年第46卷候选充电驻点位置的具体步骤如下:1)以每个传感器为圆心,充电距离为Cr半径作圆,求出圆与圆之间的交点。2)当两圆之间存在两个交点时,基于向心法则选择距离基站位置较近的交点,将其加入候选充电驻点集合U。3)当两圆之间只有一个交点时,则将该点加入候选充电驻点集合U。4)若存在独立的圆,即不与其他圆相交,则将该圆圆心加入候选充电驻点集合U。如图 2所示,以传感器节点为圆心作圆,黑色菱形即为候选充电驻点位置。由于此方法得出的充电驻点数量较大,不利于求解最短充电路径,接下来将基
17、于选址问题中的带权集合覆盖问题,求得最优充电驻点集。图2 确定候选充电驻点2.2 确定最优充电驻点集考虑到驻点选取问题与选址问题的相似性,将驻点选取问题抽象成带权集合覆盖问题,则是求解满足覆盖所有传感器节点的前提下,充电驻点总的位置个数最少且 距 离 最 小 的 问 题。对 于 传 感 器 节 点 集 合V=v1,v2,vn,候选充电驻点集合U=u1,u2,um,定义候选充电驻点到基站的距离为权值。将驻点选取问题转换为求解带权集合覆盖问题,其形式化定义如下:输 入:V=v1,v2,vn,U=u1,u2,um,W(U)=w(r1),w(r2),w(rm)(w(ri)0,1 i m),其中ui V
18、,1 i m。输出:C U,uk=V,且最小化w(uk),uk C。为确定最优驻点集合,本文通过带权集合覆盖问题的一种随机近似算法 WSC_RA,从概率的角度出发,多次运行求得最优覆盖集合。此外该算法时间复杂度O(n)远小于解决集合覆盖问题最常用的贪婪算法,其优化结果如图3所示,五角星位置表示最终确定的充电驻点。图3 确定最优充电驻点2.3 基于竞争深度Q网络的充电路径规划算法2.3.1 学习模型本文基于马尔科夫模型对文中描述的充电场景进行建模,将无线可充电传感器网络视为强化学习中的环境,将负责执行充电决策的 MC视为智能体。该模型可以由四元组表示,其中S是状态空间,A是动作空间,P是状态迁移
19、模型,R是即时奖励12,具体建模如下:1)状态空间S:该模型的状态由 MC的剩余电量和WRSN中所有传感器节点的状态两部分组成。S=(3)Snetwork=s1,s2,sn(4)式中:EMC表示MC的剩余电量;Snetwork表示传感器节点的状态集合;si表示第i个传感器节点的状态,由两部分组成,即坐标位置信息(xi,yi)、剩余能量信息rei。si的表达式如式(5)所示:si=(xi,yi,rei)(5)2)动作空间A:MC 的基本动作集合A中包含 2 种基本动作,如式(6)所示:A=|a a 1,2,m+1(6)当a=m+1,表示 MC 返回基站进行能量补充;当a=i(i 1,2,m),表
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 基于 选址 机制 深度 强化 学习 WRSN 移动 能量 补充
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,个别因单元格分列造成显示页码不一将协商解决,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【自信****多点】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【自信****多点】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。