基于最大熵的演员-评论家框架的AUV运动规划方法

Invention Grant

CN113534668B 基于最大熵的演员-评论家框架的AUV运动规划方法有权

Please log in to see more content

Patent Title: 基于最大熵的演员-评论家框架的AUV运动规划方法
Application No.: CN202110930108.0

Application Date: 2021-08-13
Publication No.: CN113534668B

Publication Date: 2022-06-10
Inventor: 孙玉山 , 于鑫 , 张国成 , 罗孝坤 , 薛源 , 张红星 , 柴璞鑫
Applicant: 哈尔滨工程大学
Applicant Address: 黑龙江省哈尔滨市南岗区南通大街145号
Assignee: 哈尔滨工程大学
Current Assignee: 哈尔滨工程大学
Current Assignee Address: 黑龙江省哈尔滨市南岗区南通大街145号
Agency: 成都方圆聿联专利代理事务所
Agent 邓永红
Main IPC: G05B13/04
IPC: G05B13/04

Abstract:

本发明公开了基于最大熵的演员‑评论家框架的AUV运动规划方法，包括以下步骤：S1：构建AUV操纵性模型；S2：确定AUV的状态空间与动作空间；S3：基于MDP决策过程，提出基于最大熵的强化学习算法，构建神经网络结构，搭建AUV运动规划系统；S4：设置一个综合的奖励函数来评估AUV决策的优劣，指导AUV完成运动规划任务的目标：在躲避障碍物到达目标点的同时，航行路程及所用时间达到最优；S5：通过自交互训练获得最优策略，保存训练好的神经网络参数，将最优策略对应的具体指令传递给下位机，最终实现感知‑规划‑控制的运动规划过程；本发明能够发现到达目标位置的多种策略，在应对各种突发态势时有较好的鲁棒性，且能在多约束的条件下顺利完成指定任务。

Public/Granted literature

CN113534668A 基于最大熵的演员-评论家框架的AUV运动规划方法 Public/Granted day:2021-10-22

Information query

Chinese Patent Announcement Global Dossier Espacenet

IPC分类:

G	物理
G05	控制；调节
G05B	一般的控制或调节系统；这种系统的功能单元；用于这种系统或单元的监视或测试装置（应用流体作用的一般流体压力执行器或系统入F15B；阀门本身入F16K；仅按机械特征区分的入G05G；传感元件见相应小类，例如G12B，G01、H01的小类；校正单元见相应的小类，例如H02K）
G05B13/00	自适应控制系统，即系统按照一些预定的准则自动调整自己使之具有最佳性能的系统（G05B19/00优先；机器学习G06N 20/00）
G05B13/02	.电的
G05B13/04	..包括使用模型或模拟器的