一种面向闭环工业大数据的逆强化学习控制器设计方法

发明公开

CN118348797A 一种面向闭环工业大数据的逆强化学习控制器设计方法审中-实审

请登陆查看更多内容

专利标题： 一种面向闭环工业大数据的逆强化学习控制器设计方法
申请号： CN202410574733.X

申请日： 2024-05-10
公开(公告)号： CN118348797A

公开(公告)日： 2024-07-16
发明人: 苏宏业 , 林润泽 , 谢磊
申请人： 浙江大学
申请人地址： 浙江省杭州市西湖区余杭塘路866号
专利权人： 浙江大学
当前专利权人： 浙江大学
当前专利权人地址： 浙江省杭州市西湖区余杭塘路866号
代理机构： 杭州求是专利事务所有限公司
代理商 傅朝栋; 张法高
主分类号： G05B13/04
IPC分类号： G05B13/04

摘要：

本发明公开了一种面向闭环工业大数据的逆强化学习控制器设计方法，包括：首先，将历史闭环工业大数据作为专家示教的轨迹来源，构建强化学习的状态空间、动作空间及交互环境，训练逆强化学习智能体；其次，在逆强化学习训练过程中，基于生成对抗网络和闭环工业大数据进行完全离线的控制器设计，使其产生的轨迹分布和历史闭环大数据一致；最后，将训练好的逆强化学习智能体用于在线优化控制。本发明为逆强化学习智能体赋予了从历史工业大数据中学习控制器的能力，有效提升强化学习算法的样本效率和安全性，从而提供了一种工业控制器设计的纯数据驱动解决方案。

信息查询

中国专利公布公告 Global Dossier Espacenet

IPC分类:

G	物理
G05	控制；调节
G05B	一般的控制或调节系统；这种系统的功能单元；用于这种系统或单元的监视或测试装置（应用流体作用的一般流体压力执行器或系统入F15B；阀门本身入F16K；仅按机械特征区分的入G05G；传感元件见相应小类，例如G12B，G01、H01的小类；校正单元见相应的小类，例如H02K）
G05B13/00	自适应控制系统，即系统按照一些预定的准则自动调整自己使之具有最佳性能的系统（G05B19/00优先；机器学习G06N 20/00）
G05B13/02	.电的
G05B13/04	..包括使用模型或模拟器的