一种基于最大权重调度策略的时延和时新联合优化方法

    公开(公告)号:CN115442910B

    公开(公告)日:2023-04-07

    申请号:CN202211249575.8

    申请日:2022-10-12

    IPC分类号: H04W72/542 H04W72/53

    摘要: 本发明公开了一种基于最大权重调度策略的时延和时新联合优化方法,S1.构建时延和时新联合的优化模型,并确定联合优化的目标问题;S2.设计联合调度框架,所述联合调度框架包含权重评估模块、排序模块和信道分配模块;S3.确定联合优化的目标优化问题所对应的调度策略,作为时延和时新联合优化结果。本发明适用于存在高维状态空间和行动空间的马尔科夫决策过程,高效实现了延迟和时新的联合优化。

    一种基于最大权重调度策略的时延和时新联合优化方法

    公开(公告)号:CN115442910A

    公开(公告)日:2022-12-06

    申请号:CN202211249575.8

    申请日:2022-10-12

    IPC分类号: H04W72/12

    摘要: 本发明公开了一种基于最大权重调度策略的时延和时新联合优化方法,S1.构建时延和时新联合的优化模型,并确定联合优化的目标问题;S2.设计联合调度框架,所述联合调度框架包含权重评估模块、排序模块和信道分配模块;S3.确定联合优化的目标优化问题所对应的调度策略,作为时延和时新联合优化结果。本发明适用于存在高维状态空间和行动空间的马尔科夫决策过程,高效实现了延迟和时新的联合优化。

    一种基于深度强化学习的组播调度方法

    公开(公告)号:CN113490157A

    公开(公告)日:2021-10-08

    申请号:CN202110761307.3

    申请日:2021-07-06

    发明人: 黄川 崔曙光 李然

    IPC分类号: H04W4/06 H04W72/12

    摘要: 本发明公开了一种基于深度强化学习的组播调度方法,所述方法包括以下步骤:S1.构建组播网络模型并确定组播调度的目标问题;设一个小区中,用户随机请求提前缓存在基站里的N种内容,基站采用M个可用信道施行这N个内容的组播传输;考虑时隙化的模型,组播传输的开始和结束都发生在时隙的初始或结尾,而不会发生在时隙中间;S2.构建组播网络的离线学习模型;S3.进行离线训练得到成熟的模型;S4.对训练得到的模型进行在线应用,实现组播调度。本发明提供的组播调度方法,适用于带有时变约束条件和高维离散行动空间的马尔科夫决策过程,有效实现了异步组播通信下的组播调度。