一种基于深度强化学习的自动化码头协同调度方法

    公开(公告)号:CN113988443B

    公开(公告)日:2024-06-28

    申请号:CN202111299059.1

    申请日:2021-11-04

    摘要: 本发明针对自动化港口调度领域,传统的精确算法和近似算法无法满足大规模调度问题快速求解以及难以适应动态生产环境的特点,公开了一种基于深度强化学习的自动化码头协同调度方法,该方法将自动化集装箱码头岸桥、ART与场桥协同作业过程建模为一个三阶段的带不相关并行机的混合流水车间调度问题,并将该问题转化为一个多agent的马尔科夫决策过程,根据港口实际装卸情况调整智能体动作,然后使用actor‑critic双网络算法进行求解,其中actor网络负责输出动作、执行调度任务,critic网络负责对actor网络的执行结果给出评价,指导actor网络的行为。本发明将集装箱装卸过程中的每一台设备视作一个智能体,避免了当机器故障时需要重新规划调度计划的情况,使得调度更加灵活。

    一种基于深度强化学习的自动化码头协同调度方法

    公开(公告)号:CN113988443A

    公开(公告)日:2022-01-28

    申请号:CN202111299059.1

    申请日:2021-11-04

    摘要: 本发明针对自动化港口调度领域,传统的精确算法和近似算法无法满足大规模调度问题快速求解以及难以适应动态生产环境的特点,公开了一种基于深度强化学习的自动化码头协同调度方法,该方法将自动化集装箱码头岸桥、ART与场桥协同作业过程建模为一个三阶段的带不相关并行机的混合流水车间调度问题,并将该问题转化为一个多agent的马尔科夫决策过程,根据港口实际装卸情况调整智能体动作,然后使用actor‑critic双网络算法进行求解,其中actor网络负责输出动作、执行调度任务,critic网络负责对actor网络的执行结果给出评价,指导actor网络的行为。本发明将集装箱装卸过程中的每一台设备视作一个智能体,避免了当机器故障时需要重新规划调度计划的情况,使得调度更加灵活。