发明公开
- 专利标题: 一种基于改进强化学习的输电线路路径规划方法
-
申请号: CN202410236851.X申请日: 2024-03-01
-
公开(公告)号: CN118333249A公开(公告)日: 2024-07-12
- 发明人: 陈然 , 胡佳 , 周蠡 , 许汉平 , 蔡杰 , 贺兰菲 , 徐昊天 , 李吕满 , 周英博 , 孙利平 , 廖晓红 , 熊川羽 , 李智威 , 马莉 , 乔诗慧 , 熊一 , 张赵阳 , 舒思睿 , 徐桂彬
- 申请人: 国网湖北省电力有限公司经济技术研究院 , 国网湖北省电力有限公司 , 湖北华中电力科技开发有限责任公司
- 申请人地址: 湖北省武汉市武昌区水果湖街徐东路47号; ;
- 专利权人: 国网湖北省电力有限公司经济技术研究院,国网湖北省电力有限公司,湖北华中电力科技开发有限责任公司
- 当前专利权人: 国网湖北省电力有限公司经济技术研究院,国网湖北省电力有限公司,湖北华中电力科技开发有限责任公司
- 当前专利权人地址: 湖北省武汉市武昌区水果湖街徐东路47号; ;
- 代理机构: 武汉市首臻知识产权代理有限公司
- 代理商 马惠丹
- 主分类号: G06Q10/047
- IPC分类号: G06Q10/047 ; G06Q50/06 ; G06N3/092 ; G06F17/16 ; G06F17/11
摘要:
一种基于改进强化学习的输电线路路径规划方法,该方法利用栅格法构建地理信息图,利用改进强化学习模型探索最优输电线路路径;初始化环境状态,设定路径起始位置和目标位置;智能体基于当前状态在Q表中选择动作向量,将选择的动作向量与由人工势场生成的初始动作向量叠加,执行叠加后的动作向量,获得奖励值并更新环境状态和Q表;选择下一次动作向量,直至智能体到达目标位置,本轮训练结束,开始下一回合的训练,直至达到最大训练次数,输出所有训练轮次中奖励值最高的路径。本发明利用人工势场生成初始策略并编码到动作向量中,对智能体路径规划起导引作用,加快智能体的收敛和缩短探索周期,提高学习效率。