用于提升多智能体强化学习边缘计算效果的信息交互方法
摘要:
本发明公开了一种用于提升多智能体强化学习边缘计算效果的信息交互方法,包括如下步骤:构建基于部分可观察马尔可夫决策过程的边缘计算通信模型;在每个边缘节点上建立用于执行内存读取、内存填充和内存写入操作的共享内存空间;根据用户成本最小化和边缘节点效用最大化目标设定目标优化函数;设置时隙长度,时间帧长度,初始化时隙和时间帧;获取边缘节点的资源分配策略,执行内存填充操作;用户执行内存读取和内存写入操作,同时获取每个用户的计算任务、计算任务数据量和计算能力,获取计算用户的任务卸载策略;利用参与者‑批评者模型对目标优化函数进行优化;对计算任务进行划分并处理。本发明可以使边缘节点和用户的决策效用最大化。
0/0