发明公开
- 专利标题: 一种面向多任务的舰艇集群规划控制方法
-
申请号: CN202410800990.0申请日: 2024-06-20
-
公开(公告)号: CN118746992A公开(公告)日: 2024-10-08
- 发明人: 梁星星 , 黄金才 , 张勇 , 程光权 , 黄魁华 , 杜航 , 廖世江
- 申请人: 中国人民解放军国防科技大学
- 申请人地址: 湖南省长沙市开福区德雅路109号
- 专利权人: 中国人民解放军国防科技大学
- 当前专利权人: 中国人民解放军国防科技大学
- 当前专利权人地址: 湖南省长沙市开福区德雅路109号
- 代理机构: 长沙大珂知识产权代理事务所
- 代理商 伍志祥
- 主分类号: G05D1/43
- IPC分类号: G05D1/43 ; G05D1/622 ; G05D1/695
摘要:
本发明公开了一种面向多任务的舰艇集群规划控制方法,包括以下步骤:基于强化学习优化算法对海域的仿真数据进行训练,训练过程中使用多个进程进行多任务并行训练;每个舰艇计算其动作价值函数与状态价值函数之间的差异,得到优势值,并将优势值与方向熵结合,鼓励舰艇在尽可能在熵减的方向选择优势值;计算估计的优势值与基于方向熵的优势值之间的误差,并基于误差计算Q函数;采用强化学习方式进行决策;将海域实际状态输入训练后的强化学习模型中,输出各舰艇的行动策略。本申请通过每艘舰艇计算基于方向熵的优势值,并将每艘舰艇与指挥中心估计的优势值的偏差进行优化,以此来进一步调整在每个任务中的调度决策。