多边缘协作缓存调度优化方法、系统及模型训练方法
摘要:
本发明涉及协作边缘缓存领域,尤其涉及一种多边缘协作缓存调度优化方法、系统及模型训练方法。本发明提出的一种多边缘协作缓存调度优化方法,构建基于多智能体深度强化学习的MAPPO算法框架对面向反向服务迁移的多边缘协作缓存调度问题进行求解,从而可以很好地解决多智能体训练时环境不稳定的问题,而在执行时只需要本地状态信息就可以进行缓存决策,更符合实际应用场景且能够有较快的执行效率。同时MAPPO算法通过使用一个集中的Critic函数,使所有的边缘端关注整体收益,适用于多智能体的合作场景。
0/0