一种基于深度强化学习的航天起爆器生产调度方法
摘要:
本发明公开了一种基于深度强化学习的航天起爆器生产调度方法,主要涉及机器学习与智能制造领域;包括步骤:S1、从起爆器生产车间获取生产加工的实时信息;S2、根据起爆器生产车间收集的实时信息,确定起爆器柔性生产车间调度问题描述和相关假设;S3、确定起爆器生产车间调度优化的目标函数及约束条件;S4、将起爆器生产调度问题构造为马尔科夫决策模型,将实时信息转化为实时状态;S5、将实时状态信息存储在记忆库中,作为深度强化学习DQN算法训练的输入;S6、深度强化学习DQN算法的训练;S7、起爆器生产实时调度;本发明能够提高生产调度的自适应性和实时性,使调度方案能够更好地适应复杂动态的实际生产过程。
0/0