一种基于深度强化学习的无人机多跳SPMA网络智能退避方法
摘要:
本发明提出一种基于深度强化学习的无人机多跳SPMA网络智能退避方法,包括,将信道状态信息作为多跳SPMA网络中智能退避网络的输入,其中,信道状态信息包括信道占用率及其历史值、各优先级队列中的需转发数据包个数;根据智能退避网络输出退避时长,并更新智能退避网络的信道状态;根据更新后的信道占用率情况评估退避效果,根据更新后的各优先级队列中需转发数据包数目评估数据包转发成功率,并根据退避效果和数据包转发成功率得到回报值;通过智能退避网络计算不同动作对应的最大回报值,选取回报值最大的动作作为当前的输入,训练智能退避网络直至收敛;获取目标信道状态信息,将目标信道状态信息输入训练好的智能退避网络,得到最优的退避策略。
0/0