一种用于无人机轨迹优化的安全强化学习方法及系统

    公开(公告)号:CN117610639A

    公开(公告)日:2024-02-27

    申请号:CN202311143860.6

    申请日:2023-09-06

    摘要: 本发明属于无线通信技术领域,公开了一种用于无人机轨迹优化的安全强化学习方法及系统,设计并明确网络场景、无人机的信道模型和能耗模型;构建优化目标,明确最小化平均信息年龄以及限制条件;根据场景及约束条件将问题转化为约束马尔科夫决策问题,进行状态空间、动作空间建模,并针对优化目标设计奖励函数;基于STD3算法构建无人机轨迹优化算法,对模型训练,并将训练好的模型在与不同用户参数下与基准算法对比进行性能验证。本发明能够有效地解决无人机飞行轨迹规划问题,提高数据收集的质量和速度,降低运行成本和风险。能够适应复杂和动态变化的环境,实现无人机的自主飞行和智能决策,提高无人机的安全性和可靠性。