一种基于深度强化学习的电网实时自适应决策方法

发明授权

CN114217524B 一种基于深度强化学习的电网实时自适应决策方法有权

请登陆查看更多内容

专利标题： 一种基于深度强化学习的电网实时自适应决策方法
申请号： CN202111368913.5

申请日： 2021-11-18
公开(公告)号： CN114217524B

公开(公告)日： 2024-03-19
发明人: 马世乾 , 陈建 , 商敬安 , 崇志强 , 王天昊 , 韩磊 , 吴彬 , 李昂 , 张志军 , 董佳 , 孙峤 , 郭凌旭 , 黄家凯 , 袁中琛 , 穆朝絮 , 韩枭赟 , 徐娜
申请人： 国网天津市电力公司电力科学研究院 , 国网天津市电力公司 , 国家电网有限公司
申请人地址： 天津市西青区海泰华科四路8号; ;
专利权人： 国网天津市电力公司电力科学研究院,国网天津市电力公司,国家电网有限公司
当前专利权人： 国网天津市电力公司电力科学研究院,国网天津市电力公司,国家电网有限公司
当前专利权人地址： 天津市西青区海泰华科四路8号; ;
代理机构： 天津盛理知识产权代理有限公司
代理商 王来佳
主分类号： G05B13/02
IPC分类号： G05B13/02 ; G05B13/04 ; G06N3/092 ; G06N3/006 ; G06N3/096 ; G06N3/09

摘要：

本发明涉及一种基于深度强化学习的电网实时自适应决策方法，包括如下步骤：步骤1、将新型电力系统机组自适应调度问题建模为马尔科夫决策过程；步骤2、研究SAC算法的基础原理，求解使得步骤1中MDP模型累计奖励值最大的策略；步骤3、设计基于IL中行为克隆的神经网络预训练方案，模拟专家经验，优化原始动作空间，提出IL‑SAC算法，并基于IL‑SAC算法以及105个真实电网场景数据训练相应的电网优化调度智能体，在测试时该智能体应对不同的电网场景数据能够输出实时决策方案，实现新型电网系统的智能调控。本发明能够实时地输出电网调度策略。

公开/授权文献

CN114217524A 一种基于深度强化学习的电网实时自适应决策方法公开/授权日：2022-03-22

信息查询

中国专利公布公告 Global Dossier Espacenet

IPC分类:

G	物理
G05	控制；调节
G05B	一般的控制或调节系统；这种系统的功能单元；用于这种系统或单元的监视或测试装置（应用流体作用的一般流体压力执行器或系统入F15B；阀门本身入F16K；仅按机械特征区分的入G05G；传感元件见相应小类，例如G12B，G01、H01的小类；校正单元见相应的小类，例如H02K）
G05B13/00	自适应控制系统，即系统按照一些预定的准则自动调整自己使之具有最佳性能的系统（G05B19/00优先；机器学习G06N 20/00）
G05B13/02	.电的