基于Dueling架构深度强化学习的柔性作业车间实时调度方法

    公开(公告)号:CN116880425A

    公开(公告)日:2023-10-13

    申请号:CN202311089367.0

    申请日:2023-08-28

    IPC分类号: G05B19/418

    摘要: 本发明公开了基于Dueling架构深度强化学习的柔性作业车间实时调度方法,包括构建工件随机抵达的DFJSP数学模型,设计柔性作业车间环境状态空间,车间环境状态空间包括车间加工机床总数、单位时间独立加工工件到达平均数、新插入工件数、估计的机床平均利用率以及实际的机床平均利用率,设计调度分配规则,基于DFJSP数学模型设计即时奖励函数,设计行动策略,设计调度智能体,所述调度智能体包括一个在线网络和一个目标网络,设置重调度时刻并计算重调度时刻所需的工序数之和,根据工序数之和对车间进行调度。通过深度强化学习算法从不同生产状态中学习到最优调度行动,提高了机床利用率,在工件动态到达时刻有效地重调度和决策优化,能够进行实时调度。