一种基于强化学习算法的PID控制器参数自整定方法

    公开(公告)号:CN118244618A

    公开(公告)日:2024-06-25

    申请号:CN202410336652.6

    申请日:2024-03-22

    IPC分类号: G05B11/42

    摘要: 本发明公开了一种基于强化学习算法的PID控制器参数自整定方法,包括以下步骤:通过算法损失函数设计,并对网络输入量进行预处理;构建近端策略优化强化学习算法与PID算法复合框架;算法首先从环境中采集电机的转速信息,之后基于环境信息,批评家网络进行参数更新;基于环境信息与批评家网络输出,对演员网路参数进行优化,演员网络对PID算法内的比例、积分、微分三个参数进行动态调节;重复上述步骤,直至满足强化学习算法终止条件。与传统控制器参数整定方法相比,本发明方法主要面向应用于变工况场景的控制器,本发明的比例参数可基于当前状态,通过神经网络动态调节,使系统具有较小的超调量、上升时间、调节时间等。