一种基于深度强化学习的车辆边缘计算转移调度方法
摘要:
本发明公开了一种基于深度强化学习的车辆边缘计算转移调度方法,利用马尔可夫决策过程,针对车辆在高速公路移动的场景精确建模,并采用深度强化学习找到这个场景下的车辆边缘计算转移调度方案的最佳策略;在训练深度强化学习时,通过使用近端策略优化方法,使用卷积结构提取任务对应的特征量,调整状态和奖励的表示方式等,改善了网络的收敛性能,使得在动态环境和复杂任务的情况下,在特定的时间‑能量偏好下实现在较长时间内消耗的时间和能量最小化。
0/0