一种基于强化学习的双层智能体决策控制方法

    公开(公告)号:CN117555229A

    公开(公告)日:2024-02-13

    申请号:CN202311477893.4

    申请日:2023-11-08

    IPC分类号: G05B13/02

    摘要: 本发明公开了一种基于强化学习的双层智能体决策控制方法,包括:步骤1:定义系统的基本结构和组成部分,包括高级控制器和较低执行者;高级控制器负责与环境进行交互,并确定优化目标,较低执行者根据高级控制器的目标和当前环境状态来学习最佳操作策略;步骤2:高级控制器周期性地与环境进行交互,接收环境状态,分配任务;步骤3:较低执行者接收高级控制器分配的任务与当前的环境状态,利用近端策略优化该强化学习方法,输出应该执行的动作;步骤4:较低执行者根据策略网络选择动作并执行,利用Critic网络计算状态值函数,采用梯度下降法更新策略网络参数。本发明能够通过自动学习实现更高性能和效率的决策控制。