-
公开(公告)号:CN116400700A
公开(公告)日:2023-07-07
申请号:CN202310388896.4
申请日:2023-04-13
申请人: 华中科技大学 , 中国船舶科学研究中心
IPC分类号: G05D1/02
摘要: 本发明属于无人艇集群围捕控制技术领域,具体涉及一种无人艇集群围捕控制模型的构建方法及其应用,包括:搭建无人艇集群围捕控制网络,其输入为各无人艇的观测值,输出为作为动作决策的各无人艇运动控制器的输入控制量;采用强化学习的方式,基于奖励函数训练所述控制网络,得到无人艇集群围捕控制模型;其中,奖励函数包括:基于在渐进围捕过程中该无人艇船体与其它各无人艇之间的距离以及预设的无人艇间安全距离所确定的第一负奖励项;基于在渐进围捕过程中该无人艇船体与围捕目标之间的距离以及预设极限距离所确定的第二负奖励项;以及用于加快训练收敛速度的激励函数项。本发明摆脱普遍通过分层控制的思路,并完成指定的围捕任务。