一种基于改进强化学习的输电线路路径规划方法
摘要:
一种基于改进强化学习的输电线路路径规划方法,该方法利用栅格法构建地理信息图,利用改进强化学习模型探索最优输电线路路径;初始化环境状态,设定路径起始位置和目标位置;智能体基于当前状态在Q表中选择动作向量,将选择的动作向量与由人工势场生成的初始动作向量叠加,执行叠加后的动作向量,获得奖励值并更新环境状态和Q表;选择下一次动作向量,直至智能体到达目标位置,本轮训练结束,开始下一回合的训练,直至达到最大训练次数,输出所有训练轮次中奖励值最高的路径。本发明利用人工势场生成初始策略并编码到动作向量中,对智能体路径规划起导引作用,加快智能体的收敛和缩短探索周期,提高学习效率。
0/0