一种多无人艇避碰决策方法
摘要:
本发明涉及一种多无人艇避碰决策方法。同时考虑碰撞风险和COLREGs,通过相互速度障碍区域表示环境信息并评估环境风险,近端策略优化根据评估环境风险决策行为。使用相互速度障碍算法改进近端策略优化算法的行动空间和奖励函数,一个基于递归模块的神经网络被用来将周围不同数量障碍物的状态直接映射为行动,以解决有限信息下的避碰问题。本发明方法开发了一种新的基于相互速度障碍区域和预期碰撞时间的奖励函数,可以适应许多不同的环境并解决稀疏奖励难题。本发明结合了近端策略优化和相互速度障碍,结合两者的优点,使多无人艇在COLREGs的基础上完美实现避碰,保证了多无人艇执行任务安全航行。
0/0