一种基于强化学习的频谱资源和计算资源联合分配方法

发明授权

CN111556572B 一种基于强化学习的频谱资源和计算资源联合分配方法有权

请登陆查看更多内容

专利标题： 一种基于强化学习的频谱资源和计算资源联合分配方法
申请号： CN202010318864.3

申请日： 2020-04-21
公开(公告)号： CN111556572B

公开(公告)日： 2022-06-07
发明人: 刘芳芳 , 冯春燕 , 商晴庆
申请人： 北京邮电大学
申请人地址： 北京市海淀区西土城路10号
专利权人： 北京邮电大学
当前专利权人： 北京邮电大学
当前专利权人地址： 北京市海淀区西土城路10号
主分类号： H04W72/04
IPC分类号： H04W72/04 ; G06K9/62 ; H04W72/08

摘要：

本发明公开了一种基于强化学习的频谱资源和计算资源联合分配方法，属于无线通信技术领域。其中利用强化学习理论，令MEC系统中的URLLC用户和eMBB用户作为智能体学习分布式地自主学习频谱资源和计算资源联合分配策略，实现了在保证URLLC用户严格的时延约束的同时，最小化系统所有URLLC用户和eMBB用户时延和能耗的总成本的目的；同时，本发明建立了用于URLLC用户和eMBB用户频谱资源和计算资源联合分配的强化学习模型，通过合理设计动作空间和回报函数可获得整体最优解，实现了良好的训练收敛性能；本发明设计了分布式资源分配算法，各智能体单独维护一张Q值表，根据自己的准则进行动作选择使得Q值表的总体维度为较低，实现了较低的算法复杂度。

公开/授权文献

CN111556572A 一种基于强化学习的频谱资源和计算资源联合分配方法公开/授权日：2020-08-18

信息查询

中国专利公布公告 Global Dossier Espacenet

IPC分类:

H	电学
H04	电通信技术
H04W	无线通信网络(广播通信入H04H;使用无线链路来进行非选择性通信的通信系统，如无线扩展入H04M1/72)
H04W72/00	本地资源管理，例如，无线资源的选择或分配或无线业务量调度
H04W72/04	.无线资源分配