基于强化学习和注意力机制的智能作业调度系统

    公开(公告)号:CN114580937B

    公开(公告)日:2023-04-28

    申请号:CN202210237299.7

    申请日:2022-03-10

    Applicant: 暨南大学

    Abstract: 本发明涉及用于数据处理方法技术领域,具体涉及一种基于强化学习和注意力机制的智能作业调度系统;包括:从给定的由机器矩阵MO和工时矩阵TO描述的调度实例,生成包含动态事件的由新的机器矩阵MO′和新的工时矩阵TO′描述的调度实例,并将其作为当前交互环境;调度系统与环境进行交互,收集经验并训练;提取特征,输入D3QPN得到当前状态下不同动作的Q值;根据Q值表进行作业调度。本发明通过注意力机制有效提取出关键信息,并使用强化学习算法选择最优的调度策略解决动态作业车间问题,以此解决实际智能制造中作业的动态变化问题,让智能调度作业系统在动态作业调度环境下依然拥有不错的性能。

    基于物联网系统和强化学习的车间生产方法

    公开(公告)号:CN116414093A

    公开(公告)日:2023-07-11

    申请号:CN202310393809.4

    申请日:2023-04-13

    Applicant: 暨南大学

    Abstract: 本发明提出了一种基于物联网系统和强化学习的车间生产方法,包括:部署传感器实时收集生产线上的多模态数据并发送到中央数据处理系统;中央数据处理系统对多模态数据进行预处理;对预处理后的数据进行特征提取和融合;根据特征提取和融合的输出进行转化作为改进PPO算法的输入,使用PPO算法优化多目标柔性车间调度任务。本发明使用物联网设备收集实时生产数据,结合多模态数据进行强化学习来实现一个多目标的柔性车间生产调度方法,引入了一个长短时记忆神经网络处理多模态数据中的时序信息,并利用自注意力机制来自动识别关键信息,使用算法进行强化学习,在强化学习训练方法使用了一个多目标的奖励评价指标使得智能体可以满足多个目标的需求。

    一种基于transformer的端到端动态作业车间调度模型

    公开(公告)号:CN115034653A

    公开(公告)日:2022-09-09

    申请号:CN202210738071.6

    申请日:2022-06-27

    Applicant: 暨南大学

    Abstract: 本发明涉及用于人工智能技术领域,具体涉及一种基于transformer的端到端动态作业车间调度模型,可以应用于不同尺寸的DJSSP(作业车间调度问题)。由特征提取模块、特征压缩模块、动作选择模块所构成。特征提取模块提取生产环境特征,并利用特征压缩模块将生产环境的特征进一步压缩成定长向量。然后,动作选择模块根据压缩后的能够反映生产环境状态的定长向量,实时选择简单优先级规则。本发明所建立的模型是Transformer在DJSSP中的第一个应用,不仅提高了工业调度的生产能力,而且为未来深度学习在DJSSP中的研究提供了范式。

    一种基于transformer的端到端动态作业车间调度系统

    公开(公告)号:CN115034653B

    公开(公告)日:2023-07-11

    申请号:CN202210738071.6

    申请日:2022-06-27

    Applicant: 暨南大学

    Abstract: 本发明涉及用于人工智能技术领域,具体涉及一种基于transformer的端到端动态作业车间调度系统,可以应用于不同尺寸的DJSSP。由特征提取模块、特征压缩模块、动作选择模块所构成。特征提取模块提取生产环境特征,并利用特征压缩模块将生产环境的特征进一步压缩成定长向量。然后,动作选择模块根据压缩后的能够反映生产环境状态的定长向量,实时选择简单优先级规则。本发明所建立的系统是Transformer在DJSSP中的第一个应用,不仅提高了工业调度的生产能力,而且为未来深度学习在DJSSP中的研究提供了范式。

    基于物联网系统和强化学习的车间生产方法

    公开(公告)号:CN116414093B

    公开(公告)日:2024-01-16

    申请号:CN202310393809.4

    申请日:2023-04-13

    Applicant: 暨南大学

    Abstract: 本发明提出了一种基于物联网系统和强化学习的车间生产方法,包括:部署传感器实时收集生产线上的多模态数据并发送到中央数据处理系统;中央数据处理系统对多模态数据进行预处理;对预处理后的数据进行特征提取和融合;根据特征提取和融合的输出进行转化作为改进PPO算法的输入,使用PPO算法优化多目标柔性车间调度任务。本发明使用物联网设备收集实时生产数据,结合多模态数据进行强化学习来实现一个多目标的柔性车间生产调度方法,引入了一个长短时记忆神经网络处理多模态数据中的时序信息,并利用自注意力机制来自动识别关键信息,使用算法进行强化学习,在强化学习训练方法使用了一个多目标的奖励评价指标使得智能体可以满足多个目标的需求。

    基于强化学习和注意力机制的智能作业调度系统

    公开(公告)号:CN114580937A

    公开(公告)日:2022-06-03

    申请号:CN202210237299.7

    申请日:2022-03-10

    Applicant: 暨南大学

    Abstract: 本发明涉及用于数据处理方法技术领域,具体涉及一种基于强化学习和注意力机制的智能作业调度系统;包括:从给定的由机器矩阵MO和工时矩阵TO描述的调度实例,生成包含动态事件的由新的机器矩阵MO′和新的工时矩阵TO′描述的调度实例,并将其作为当前交互环境;调度系统与环境进行交互,收集经验并训练;提取特征,输入D3QPN得到当前状态下不同动作的Q值;根据Q值表进行作业调度。本发明通过注意力机制有效提取出关键信息,并使用强化学习算法选择最优的调度策略解决动态作业车间问题,以此解决实际智能制造中作业的动态变化问题,让智能调度作业系统在动态作业调度环境下依然拥有不错的性能。

Patent Agency Ranking