一种基于强化学习的GEO卫星多波束功率分配方法
摘要:
本发明提出一种基于强化学习的GEO卫星多波束功率分配方法,属于通信技术领域。该方法构建了GEO卫星多波束功率分配的强化学习模型,定义了其状态空间、行动空间,并设置状态‑行动值回馈值函数,其中,状态‑行动值回馈值函数定义为通信覆盖面积和通信质量的函数,当回馈值不断提升时表征着通信覆盖面积和通信质量均在提升。利用基于模型的强化学习架构,采用随机探索结合最优值演进的方式探索GEO卫星多波束功率分配最优模型。本发明可在不同波束之间对星载受限功率资源进行灵活分配和调度,实现通信质量和通信覆盖区域的同时提升。
0/0