Invention Publication
- Patent Title: 基于强化学习的无人机路径规划方法及相关设备
-
Application No.: CN202311634313.8Application Date: 2023-11-30
-
Publication No.: CN118261309APublication Date: 2024-06-28
- Inventor: 朱红 , 蒋承伶 , 王艳茹 , 王文帝 , 欧清海 , 马文洁 , 张明 , 张宁池 , 孙凯 , 刘卉 , 邵苏杰 , 宋继高 , 章林 , 张英帅 , 刘椿枫 , 郭少勇 , 张洁 , 王颖 , 石慧 , 何海洋
- Applicant: 国网江苏省电力有限公司南京供电分公司 , 北京中电飞华通信有限公司 , 国网江苏省电力有限公司 , 国网信息通信产业集团有限公司 , 北京邮电大学 , 国家电网有限公司
- Applicant Address: 江苏省南京市建邺区奥体大街1号; ; ; ; ;
- Assignee: 国网江苏省电力有限公司南京供电分公司,北京中电飞华通信有限公司,国网江苏省电力有限公司,国网信息通信产业集团有限公司,北京邮电大学,国家电网有限公司
- Current Assignee: 国网江苏省电力有限公司南京供电分公司,北京中电飞华通信有限公司,国网江苏省电力有限公司,国网信息通信产业集团有限公司,北京邮电大学,国家电网有限公司
- Current Assignee Address: 江苏省南京市建邺区奥体大街1号; ; ; ; ;
- Agency: 北京风雅颂专利代理有限公司
- Agent 唐微
- Main IPC: G06Q10/047
- IPC: G06Q10/047 ; G06N20/00 ; G06F18/23

Abstract:
本公开提供一种基于强化学习的无人机路径规划方法及相关设备。所述方法包括:获取第一无人机的第一状态;基于第一无人机的第一状态和第一动作,确定第一无人机的下一状态;确定第一无人机从第一状态运行到下一状态对应的第一奖励,基于第一奖励和更新次数确定第一强化值;响应于第一强化值满足预设的条件,对第一状态进行更新得到下一状态;基于第一状态中的第一初始位置和下一状态中的第一目标位置,确定第一无人机的第一最佳路径;基于第一最佳路径确定第二无人机的第二状态;通过延迟强化学习算法对第二状态进行递归处理,得到第二无人机的第二最佳路径。
Information query