基于多智能体近端策略的车联网分布式边缘缓存决策方法

    公开(公告)号:CN115277845B

    公开(公告)日:2024-07-19

    申请号:CN202210867388.X

    申请日:2022-07-22

    摘要: 本发明公开了一种基于多智能体近端策略的车联网分布式边缘缓存决策方法,具体为:输入车辆边缘网络环境,初始化执行者‑评估者网络参数;各车辆用户观测自身坐标及各边缘接入点剩余存储空间;各车辆用户根据策略选择边缘接入点,执行边缘缓存动作;各车辆用户计算时延相关奖励,根据广义优势估计方法计算回报与优势;根据收集的动作、观测和奖励信息,各车辆用户通过共享的策略网络进行集中式训练,以截断方法约束策略的更新,计算执行者‑评估者网络的损失函数且更新共享策略,实现分布式车联网边缘缓存决策。本发明使得车联网用户中每个车辆用户智能体能够充分利用自身观测信息,协同分配系统边缘缓存资源,从而降低缓存内容传输时延。

    基于多智能体近端策略的车联网分布式边缘缓存决策方法

    公开(公告)号:CN115277845A

    公开(公告)日:2022-11-01

    申请号:CN202210867388.X

    申请日:2022-07-22

    摘要: 本发明公开了一种基于多智能体近端策略的车联网分布式边缘缓存决策方法,具体为:输入车辆边缘网络环境,初始化执行者‑评估者网络参数;各车辆用户观测自身坐标及各边缘接入点剩余存储空间;各车辆用户根据策略选择边缘接入点,执行边缘缓存动作;各车辆用户计算时延相关奖励,根据广义优势估计方法计算回报与优势;根据收集的动作、观测和奖励信息,各车辆用户通过共享的策略网络进行集中式训练,以截断方法约束策略的更新,计算执行者‑评估者网络的损失函数且更新共享策略,实现分布式车联网边缘缓存决策。本发明使得车联网用户中每个车辆用户智能体能够充分利用自身观测信息,协同分配系统边缘缓存资源,从而降低缓存内容传输时延。