基于逆强化学习的多小区网络功率分配方法及系统

    公开(公告)号:CN117580067A

    公开(公告)日:2024-02-20

    申请号:CN202311549505.9

    申请日:2023-11-20

    Abstract: 本发明提供基于逆强化学习的多小区网络功率分配方法及系统,涉及网络优化设计领域。该基于逆强化学习的多小区网络功率分配方法,包括:接收待优化小区中用户设备信息及优化基站信息;根据待优化小区中用户设备信息及优化基站信息建立优化问题,所述优化问题目标是在满足每个用户设备最小数据速率的同时最大化速率和;获取状态空间和动作空间,所述状态空间包括上一时隙的所有用户的信道信息、动作信息和奖励信息;将状态空间和动作空间输入到预设的逆强化学习模型中进行训练,供预设的逆强化学习模型学习得到奖励函数;利用所述奖励函数求解优化问题。该方法能在用户设备(UEs)的最小数据速率要求的约束下找到最优的功率分配策略。

Patent Agency Ranking