无线传感器网络中基于深度强化学习的一对多能量补充方法
摘要:
本发明提供一种无线传感器网络中基于深度强化学习的一对多能量补充方法。先将充电驻点选取问题抽象为选址中的带权集合覆盖问题,基于WSC_RA算法求解出近似最优充电驻点集合,在覆盖所有传感器的前提下,驻点的总的位置个数最少。在确定充电驻点的基础上,基于dueling DQN算法对全局信息进行规划,综合考虑传感器的能量消耗率、地理位置等因素确定访问充电驻点的顺序。将状态空间和行为空间离散化,根据充电场景设计奖励函数,捕捉充电动作在时间序列中的关系,自适应地调整充电路径。同时基于Gradient Bandit策略采样,加快神经网络训练速度。本发明实时考虑全局充电调度,避免传感器能量耗尽死亡的同时提高网络的平均剩余能量,延长网络生存寿命。
0/0