基于深度强化学习的潮流收敛自动调整方法及系统

    公开(公告)号:CN112787331A

    公开(公告)日:2021-05-11

    申请号:CN202110114628.4

    申请日:2021-01-27

    IPC分类号: H02J3/06

    摘要: 本申请实施例公开了一种基于深度强化学习的潮流收敛自动调整方法及系统。所述方法包括:获取电网数据,形成数据样本;根据构建的强化学习模型,将数据样本生成状态空间;所述强化学习模型进行构建时包括,选取控制动作,形成动作空间;根据数据集中多个数据样本的潮流状态以及根据动作空间中执行控制动作与所形成的工作状态的映射关系,构建状态空间;从状态空间中获取电网系统的当前运行状态,基于所述当前的运行状态形成的最终网络参数,调整潮流收敛,输出调整方案。本技术方案,可以实现大规模电网潮流收敛的自动调整,减少运行方式制定人员的工作强度,提高工作效率。

    深度Q网络驱动的电力系统运行方式自动趋优调整方法

    公开(公告)号:CN111523737A

    公开(公告)日:2020-08-11

    申请号:CN202010478336.4

    申请日:2020-05-29

    摘要: 本发明公开了一种深度Q网络驱动的电力系统运行方式自动趋优调整方法;以典型运行方式为调整的基准方式,确定负荷波动范围,并结合拉丁超立方抽样方法生成大量用于训练和测试的目标方式样本数据;确定电网模型中所有可行的单次控制动作,并进行编号,将其设定为动作空间;初始化电网模型,判断是否存在未训练过的样本,若存在则将样本中的负荷数据赋值给电网模型,并对当前运行方式发电机出力数据进行收敛性优化处理,若不存在则终止训练等。本发明保证计算速度的同时弥补了最优潮流方法在求解多目标最优潮流时难以收敛的问题,调整后所得方式的各项指标并无过大偏差,为深度强化学习应用于电网优化和控制问题提供方法参考。