基于通感算控的无线资源分配方法、装置及计算机设备
摘要:
本申请提供的基于通感算控的无线资源分配方法、装置及计算机设备,应用于无线网络系统,其中,先获取无线网络系统的多个初始状态参数,采用自适应窗口从各个初始状态参数中进行抽取,得到当前状态参数;根据当前状态参数,采用ε‑greedy策略选择并执行无线资源分配动作后,计算下一状态参数,利用奖励函数计算当前状态奖励值;根据当前状态参数及其无线资源分配动作,采用主网络评估当前状态Q值,根据下一状态参数和主网络的当前网络参数,采用目标网络预测下一状态Q值;采用损失函数更新主网络的网络参数,将无线网络系统的下一状态参数作为当前状态参数。如此,通过结合自适应窗口和深度双Q网络,实现了无线资源的合理分配。
0/0