Abstract:
本公开提供一种基于强化学习的无人机路径规划方法及相关设备。所述方法包括:获取第一无人机的第一状态;基于第一无人机的第一状态和第一动作,确定第一无人机的下一状态;确定第一无人机从第一状态运行到下一状态对应的第一奖励,基于第一奖励和更新次数确定第一强化值;响应于第一强化值满足预设的条件,对第一状态进行更新得到下一状态;基于第一状态中的第一初始位置和下一状态中的第一目标位置,确定第一无人机的第一最佳路径;基于第一最佳路径确定第二无人机的第二状态;通过延迟强化学习算法对第二状态进行递归处理,得到第二无人机的第二最佳路径。
Patent Agency Ranking
0/0