基于深度强化学习的电网拓扑优化和潮流控制的方法

    公开(公告)号:CN114065452A

    公开(公告)日:2022-02-18

    申请号:CN202111362751.4

    申请日:2021-11-17

    摘要: 本发明提供了一种基于深度强化学习的电网拓扑优化和潮流控制的方法,包括:构建智能体;获取历史断面潮流数据,并对多历史断面潮流数据进行模仿学习,以确定智能体的参数的初始值;对t时刻的在线断面潮流数据进行训练,得到N个动作价值排在前列的控制策略;在电网环境仿真器中验证N个价值排在前列的控制策略,获得回报最高的控制策略;执行回报最高的控制策略,得到执行该控制策略的奖励值;t的取值加1;循环求奖励值的步骤,每求得M次奖励值,根据动作价值函数的目标值更新智能体参数,完成所有时刻的在线断面潮流数据的智能体训练,从中选出最优的智能体参数;使用训练好的智能体在实时环境下完成电网拓扑优化和潮流控制。