基于深度强化学习的边缘计算中计算卸载与资源管理方法
摘要:
本发明公开了一种基于深度强化学习的边缘计算中计算卸载与资源管理方法,包括如下步骤:基于部分可观察马尔可夫决策过程构建边缘计算通信模型,包括M+N个智能体,M个智能体为边缘节点,N个智能体为用户;根据用户成本最小化和边缘节点效用最大化目标设定目标优化函数;设置时隙长度,时间帧长度,初始化时隙和时间帧;边缘节点和用户分别利用部分可观察马尔可夫决策过程获取资源分配策略和任务卸载策略;根据任务卸载策略和资源分配策略利用参与者‑批评者模型对目标优化函数进行优化;根据优化后的目标优化函数将计算任务进行划分并处理。本发明解决了边缘设备与用户之间的不同利益追求,最大化地确保各自利益。
0/0