一种基于强化学习的船智能体智能控制方法及装置
Abstract:
本发明涉及一种基于强化学习的船智能体智能控制方法及装置,包括以下:S1、初始化船智能体;S2、获取船智能体当前状态,所述当前状态包括船智能体于当前的航向角#imgabs0#速度v以及地理位置;S3、结合当前状态以及奖励函数,通过策略于动作空间中选择相应的舵角,并采取行动更新当前状态;S4、基于更新的当前状态,通过奖励函数计算奖励值;S5、基于更新的当前状态以及计算得到的奖励值更新Q—table(s,a)的值;S6、判断是否达到预设的终止条件,若是则输出最终的奖励函数以及策略即更新后的Q—table,若否则返回S2。本发明改进了传统船舶航道强化学习中,在极端的环境下偏向于选择大的舵角的问题,且能够更好地对船智能体进行控制。
Public/Granted literature
Patent Agency Ranking
0/0