基于离散MADDPG的边缘缓存决策模型、方法和系统
摘要:
基于离散MADDPG的边缘缓存决策模型、方法和系统,所述边缘缓存决策模型适用于用户终端、云服务器和多个RSU组成的通信网络;所述边缘缓存决策模型基于神经网络构建,其与RSU一一对应,所述边缘缓存决策模型用于根据RSU的状态生成对应的动作决策。本发明将多智能体深度强化学习中的离散MADDPG算法引入协作边缘缓存,能够实现智能体间的合作通信且有强大的决策能力,可以很好地实现缓存决策且控制缓存冗余。
0/0