基于局部数据增强的流程工业强化学习控制的加速方法

    公开(公告)号:CN113836788A

    公开(公告)日:2021-12-24

    申请号:CN202110972643.2

    申请日:2021-08-24

    申请人: 浙江大学

    摘要: 本发明公开了一种基于局部数据增强的流程工业强化学习控制的加速方法,包括:首先,在强化学习训练过程中,在历史案例库中检索与当前状况相似的案例,将其作为局部模态下的邻近数据;其次,利用这些检索到的基于案例的知识,在局部操作范围内建立辅助的局部动力学模型;然后,使用在线建立的局部动力学模型生成一系列虚拟的案例,作为经验回放缓冲区的增广案例;最后,将生成的虚拟案例和交互获得的真实案例合并,共同组成一个新的联合经验回放缓冲区,用于更新强化学习智能体。本发明可有效地提升强化学习智能体在跨模态/跨工况情况下的训练效率以及迁移学习能力,从而为流程工业智能优化控制奠定基础。

    基于元逆强化学习的流程制造价值链挖掘与工业控制方法

    公开(公告)号:CN118131708A

    公开(公告)日:2024-06-04

    申请号:CN202410235130.7

    申请日:2024-03-01

    申请人: 浙江大学

    IPC分类号: G05B19/418

    摘要: 本发明公开了基于元逆强化学习的流程制造价值链挖掘与工业控制方法,包括:首先,通过引入隐变量作为流程制造价值链挖掘的模态指示变量,构建增广MDP定义;其次,使用隐变量决定的奖励函数和条件策略,描述逆强化学习控制器设计和价值链挖掘问题;然后,在元逆强化学习训练过程中,利用推理网络估计当前所处的模态,针对不同的模态求解一个通用的但可区分模态的多模态控制器;最后,将训练好的元逆强化学习智能体用于在线价值链挖掘与工业控制。本发明为逆强化学习智能体赋予了从历史闭环数据中学习多模态行为的能力,提升其在跨模态场景下的迁移学习效率,从而提供了一种流程制造价值链挖掘与工业控制器设计的数据驱动解决方案。

    数字孪生驱动的机械臂建模、控制与监测一体化集成系统

    公开(公告)号:CN111496781B

    公开(公告)日:2021-08-03

    申请号:CN202010186762.0

    申请日:2020-03-17

    申请人: 浙江大学

    IPC分类号: B25J9/16

    摘要: 本发明公开了一种数字孪生驱动的机械臂建模、控制与监测一体化集成系统,包括:数字孪生仿真模型构建模块,基于机械臂CAD装配体模型构建机械臂数字孪生集成仿真模型;机械臂控制模块,实现机械臂数字孪生集成仿真模型的闭环反馈控制;数据采集、预处理与特征构建模块,采集机械臂运行数据并进行预处理,根据机械臂运动学及动力学特性构建用于机械臂故障监测的机理特征;故障监测模块,利用预处理好的机械臂运行数据与构建的机理特征对机械臂数字孪生集成仿真模型闭环运行过程的机械臂运行状态进行实时监测。本发明可有效地实现智能装配机械臂的预期轨迹跟踪控制和数字孪生闭环系统运行过程的实时故障监测。

    一种面向闭环工业大数据的逆强化学习控制器设计方法

    公开(公告)号:CN118348797A

    公开(公告)日:2024-07-16

    申请号:CN202410574733.X

    申请日:2024-05-10

    申请人: 浙江大学

    IPC分类号: G05B13/04

    摘要: 本发明公开了一种面向闭环工业大数据的逆强化学习控制器设计方法,包括:首先,将历史闭环工业大数据作为专家示教的轨迹来源,构建强化学习的状态空间、动作空间及交互环境,训练逆强化学习智能体;其次,在逆强化学习训练过程中,基于生成对抗网络和闭环工业大数据进行完全离线的控制器设计,使其产生的轨迹分布和历史闭环大数据一致;最后,将训练好的逆强化学习智能体用于在线优化控制。本发明为逆强化学习智能体赋予了从历史工业大数据中学习控制器的能力,有效提升强化学习算法的样本效率和安全性,从而提供了一种工业控制器设计的纯数据驱动解决方案。

    基于局部数据增强的流程工业强化学习控制的加速方法

    公开(公告)号:CN113836788B

    公开(公告)日:2023-10-27

    申请号:CN202110972643.2

    申请日:2021-08-24

    申请人: 浙江大学

    摘要: 本发明公开了一种基于局部数据增强的流程工业强化学习控制的加速方法,包括:首先,在强化学习训练过程中,在历史案例库中检索与当前状况相似的案例,将其作为局部模态下的邻近数据;其次,利用这些检索到的基于案例的知识,在局部操作范围内建立辅助的局部动力学模型;然后,使用在线建立的局部动力学模型生成一系列虚拟的案例,作为经验回放缓冲区的增广案例;最后,将生成的虚拟案例和交互获得的真实案例合并,共同组成一个新的联合经验回放缓冲区,用于更新强化学习智能体。本发明可有效地提升强化学习智能体在跨模态/跨工况情况下的训练效率以及迁移学习能力,从而为流程工业智能优化控制奠定基础。

    基于代理模型虚实迁移的有机朗肯循环强化学习控制方法

    公开(公告)号:CN115329980A

    公开(公告)日:2022-11-11

    申请号:CN202210920655.5

    申请日:2022-08-02

    申请人: 浙江大学

    IPC分类号: G06N20/00 G06N3/08

    摘要: 本发明公开了一种基于代理模型虚实迁移的有机朗肯循环强化学习控制方法,包括:(1)在余热工况存在扰动的情况下,每隔一段时间改变有机朗肯循环系统的设定值,采集历史积累的闭环运行数据;(2)利用采集的数据训练系统动力学模型,将其作为有机朗肯循环系统的代理模型;(3)利用代理模型构建强化学习预训练的虚拟仿真环境,在一个强化学习episode内设置多个设定值并加入时变的余热扰动,训练强化学习智能体;(4)将强化学习智能体的结构和参数迁移到实际有机朗肯循环控制系统,并进行微调和继续训练;(5)将强化学习智能体用于实际有机朗肯循环系统的过程控制。利用本发明,可以大幅提升训练效率,有效解决系统响应慢、计算耗时的问题。

    数字孪生驱动的机械臂建模、控制与监测一体化集成系统

    公开(公告)号:CN111496781A

    公开(公告)日:2020-08-07

    申请号:CN202010186762.0

    申请日:2020-03-17

    申请人: 浙江大学

    IPC分类号: B25J9/16

    摘要: 本发明公开了一种数字孪生驱动的机械臂建模、控制与监测一体化集成系统,包括:数字孪生仿真模型构建模块,基于机械臂CAD装配体模型构建机械臂数字孪生集成仿真模型;机械臂控制模块,实现机械臂数字孪生集成仿真模型的闭环反馈控制;数据采集、预处理与特征构建模块,采集机械臂运行数据并进行预处理,根据机械臂运动学及动力学特性构建用于机械臂故障监测的机理特征;故障监测模块,利用预处理好的机械臂运行数据与构建的机理特征对机械臂数字孪生集成仿真模型闭环运行过程的机械臂运行状态进行实时监测。本发明可有效地实现智能装配机械臂的预期轨迹跟踪控制和数字孪生闭环系统运行过程的实时故障监测。