一种基于改进强化学习的输电线路路径规划方法

发明公开

CN118333249A 一种基于改进强化学习的输电线路路径规划方法审中-实审

请登陆查看更多内容

专利标题： 一种基于改进强化学习的输电线路路径规划方法
申请号： CN202410236851.X

申请日： 2024-03-01
公开(公告)号： CN118333249A

公开(公告)日： 2024-07-12
发明人: 陈然 , 胡佳 , 周蠡 , 许汉平 , 蔡杰 , 贺兰菲 , 徐昊天 , 李吕满 , 周英博 , 孙利平 , 廖晓红 , 熊川羽 , 李智威 , 马莉 , 乔诗慧 , 熊一 , 张赵阳 , 舒思睿 , 徐桂彬
申请人： 国网湖北省电力有限公司经济技术研究院 , 国网湖北省电力有限公司 , 湖北华中电力科技开发有限责任公司
申请人地址： 湖北省武汉市武昌区水果湖街徐东路47号; ;
专利权人： 国网湖北省电力有限公司经济技术研究院,国网湖北省电力有限公司,湖北华中电力科技开发有限责任公司
当前专利权人： 国网湖北省电力有限公司经济技术研究院,国网湖北省电力有限公司,湖北华中电力科技开发有限责任公司
当前专利权人地址： 湖北省武汉市武昌区水果湖街徐东路47号; ;
代理机构： 武汉市首臻知识产权代理有限公司
代理商 马惠丹
主分类号： G06Q10/047
IPC分类号： G06Q10/047 ; G06Q50/06 ; G06N3/092 ; G06F17/16 ; G06F17/11

摘要：

一种基于改进强化学习的输电线路路径规划方法，该方法利用栅格法构建地理信息图，利用改进强化学习模型探索最优输电线路路径；初始化环境状态，设定路径起始位置和目标位置；智能体基于当前状态在Q表中选择动作向量，将选择的动作向量与由人工势场生成的初始动作向量叠加，执行叠加后的动作向量，获得奖励值并更新环境状态和Q表；选择下一次动作向量，直至智能体到达目标位置，本轮训练结束，开始下一回合的训练，直至达到最大训练次数，输出所有训练轮次中奖励值最高的路径。本发明利用人工势场生成初始策略并编码到动作向量中，对智能体路径规划起导引作用，加快智能体的收敛和缩短探索周期，提高学习效率。

信息查询

中国专利公布公告

审查信息

Global Dossier

Espacenet