一种未知伺服系统的强化学习最优跟踪控制方法
摘要:
本发明主要涉及模型未知伺服系统的强化学习最优跟踪控制器的设计方法。主要基于简化的强化学习评价‑执行结构,应用高阶神经网络逼近方法,介绍模型未知伺服系统的强化学习最优跟踪控制器的设计方法,加快电机最优跟踪控制求解速度。针对模型未知的伺服系统,首先应用多层神经网络智能辨识系统模型,求解稳态控制;给定性能指标,应用高阶神经网络逼近最优性能指标函数;根据近似的性能指标函数和辨识的系统模型建立哈密尔顿‑雅克比‑贝尔曼(HJB)方程,求得伺服系统最优反馈控制。根据求得的稳态控制和最优反馈控制,计算最优跟踪控制,使负载转角和转速快速跟踪给定信号的同时,跟踪误差积累值和系统能耗同时达到最小。
0/0