一种基于Actor-Critic算法的多智能体异构网络资源优化方法
摘要:
本发明公开了一种基于Actor‑Critic算法的多智能体异构网络能效优化方法,把异构网络中各个小基站看作为一个智能体,令每个小基站基于Actor‑Critic算法中actor网络根据当前异构网络环境和智能体状态选择合适的动作,通过Critic网络采用策略梯度方法更新其网络参数,对智能体传入动作返回q值给出评价并传递给atcor网络,不断学习更新其网络参数选取最优动作,扩展小基站的连接覆盖范围,使用户能连接到最近的小基站,并将当前时刻的状态信息传递给宏基站,在宏基站覆盖范围内重复部署小基站,使宏基站覆盖盲点的设备连接到相应的小基站以获得更好的信道,还可以将连接到宏基站的一部分设备卸载到相应的小基站,在实现网络负载均衡的同时还能增大网络的系统容量。
0/0