摘要:
本发明公开了一种基于增强学习算法的无人船侧向控制方法,建立无人船行驶的动力学模型,采用简化的船体‑路径一体化模型;根据无人船侧向控制性能的要求,选择无人船侧向控制器的设计方案;无人船侧向控制器中增强学习控制器采用Actor‑Critic结构,分为执行器网络和评价器网络;设计无人船的侧向偏差参考模型;通过对性能指标的优化,实现系统状态或输出对参考模型状态的跟随,进而保证了系统的性能优化。本发明的优点在于:增强学习基于动物学习心理学的“试误法”原理,使得无人船能够在与环境的交互过程中根据评价性的反馈信号实现序贯决策的优化,从而可以用于解决某些监督学习难以应用的优化控制问题。
公开/授权文献
- CN107346138A 一种基于增强学习算法的无人船侧向控制方法 公开/授权日:2017-11-14