-
公开(公告)号:CN118034055A
公开(公告)日:2024-05-14
申请号:CN202410246191.3
申请日:2024-03-05
Applicant: 北京理工大学
IPC: G05B13/04
Abstract: 本发明公开了基于多智能体强化学习的多车系统合作式持续监控的轨迹规划方法,属于机器人智能决策与控制领域。首先构建面向目标区域合作式持续监控的多车轨迹规划问题的马尔科夫决策过程模型;引入栅格地图的发现度函数量化地图的搜索程度,并将其用于设计无人车合作式持续监控的状态空间,并设计动作空间和奖励函数;建立策略网络和评价网络;再基于多智能体强化学习算法,在无人车每前进一步后训练更新策略网络和评价网络,直至二者收敛;最终得到多无人车系统持续监控的策略网络。本发明基于无人车系统之间多车的分布式交互估计发现度地图,使该系统能够以较低地通信成本充分利用多车信息,解决合作方式下的轨迹规划问题,实现对目标监控区域尽可能多次的全覆盖。