一种基于多智能体强化学习的矿山应急响应任务卸载方法

    公开(公告)号:CN117687714A

    公开(公告)日:2024-03-12

    申请号:CN202311714851.8

    申请日:2023-12-13

    IPC分类号: G06F9/445 G06N3/092

    摘要: 本发明公开一种基于多智能体强化学习的矿山应急响应任务卸载方法。包含以下步骤:构建矿山应急响应任务卸载模型;考虑应急响应设备计算模型,该模型包括本地计算模型和卸载计算模型,通过计算得出设备的任务总卸载时延,得出对应的优化函数;应用深度强化学习算法,建立马尔科夫决策决策模型;最后,在基于多智能体强化学习算法的基础上,采用基于行动者‑评论家模型的确定性策略梯度算法,结合DQN使用目标网络和体验回放,对智能体进行更新。本发明引入全局负载平衡惩罚因子,使全局设备任务的响应时间最小化,使边缘服务器上的负载相对均衡。本发明分布式运行解决集中式任务调度中面临的维度爆炸、可扩展性和动态性差的问题。