一种基于模型参考强化学习的无人船容错控制方法

Invention Publication

CN114296350A 一种基于模型参考强化学习的无人船容错控制方法有权

Please log in to see more content

Patent Title: 一种基于模型参考强化学习的无人船容错控制方法
Application No.: CN202111631716.8

Application Date: 2021-12-28
Publication No.: CN114296350A

Publication Date: 2022-04-08
Inventor: 张清瑞 , 熊培轩 , 张雷 , 朱波 , 胡天江
Applicant: 中山大学
Applicant Address: 广东省广州市海珠区新港西路135号
Assignee: 中山大学
Current Assignee: 中山大学
Current Assignee Address: 广东省广州市海珠区新港西路135号
Agency: 深圳市创富知识产权代理有限公司
Agent 高冰
Main IPC: G05B13/04
IPC: G05B13/04

Abstract:

本发明公开了一种基于模型参考强化学习的无人船容错控制方法，该方法包括：对无人船的不确定性因素进行分析，构建无人船名义动力学模型；基于无人船名义动力学模型，设计无人船标称控制器；基于最大熵的Actor‑Critic方法，根据实际无人船系统、无人船名义动力学模型的状态变量差值和无人船标称控制器的输出，构建基于模型参考强化学习的容错控制器；根据控制任务需求，搭建强化学习评价函数和控制策略模型并训练容错控制器，得到训练完成的控制策略。通过使用本发明，能够显著提高无人船系统的安全性和可靠性。本发明作为一种基于模型参考强化学习的无人船容错控制方法，可广泛应用于无人船控制领域。

Public/Granted literature

CN114296350B 一种基于模型参考强化学习的无人船容错控制方法 Public/Granted day:2023-11-03

Information query

Chinese Patent Announcement Global Dossier Espacenet

IPC分类:

G	物理
G05	控制；调节
G05B	一般的控制或调节系统；这种系统的功能单元；用于这种系统或单元的监视或测试装置（应用流体作用的一般流体压力执行器或系统入F15B；阀门本身入F16K；仅按机械特征区分的入G05G；传感元件见相应小类，例如G12B，G01、H01的小类；校正单元见相应的小类，例如H02K）
G05B13/00	自适应控制系统，即系统按照一些预定的准则自动调整自己使之具有最佳性能的系统（G05B19/00优先；机器学习G06N 20/00）
G05B13/02	.电的
G05B13/04	..包括使用模型或模拟器的