一种基于强化学习的频谱资源和计算资源联合分配方法
摘要:
本发明公开了一种基于强化学习的频谱资源和计算资源联合分配方法,属于无线通信技术领域。其中利用强化学习理论,令MEC系统中的URLLC用户和eMBB用户作为智能体学习分布式地自主学习频谱资源和计算资源联合分配策略,实现了在保证URLLC用户严格的时延约束的同时,最小化系统所有URLLC用户和eMBB用户时延和能耗的总成本的目的;同时,本发明建立了用于URLLC用户和eMBB用户频谱资源和计算资源联合分配的强化学习模型,通过合理设计动作空间和回报函数可获得整体最优解,实现了良好的训练收敛性能;本发明设计了分布式资源分配算法,各智能体单独维护一张Q值表,根据自己的准则进行动作选择使得Q值表的总体维度为较低,实现了较低的算法复杂度。
0/0