发明公开
- 专利标题: 一种基于深度强化学习的电网实时自适应决策方法
-
申请号: CN202111368913.5申请日: 2021-11-18
-
公开(公告)号: CN114217524A公开(公告)日: 2022-03-22
- 发明人: 马世乾 , 陈建 , 商敬安 , 崇志强 , 王天昊 , 韩磊 , 吴彬 , 李昂 , 张志军 , 董佳 , 孙峤 , 郭凌旭 , 黄家凯 , 袁中琛 , 穆朝絮 , 韩枭赟 , 徐娜
- 申请人: 国网天津市电力公司电力科学研究院 , 国网天津市电力公司 , 国家电网有限公司
- 申请人地址: 天津市西青区海泰华科四路8号; ;
- 专利权人: 国网天津市电力公司电力科学研究院,国网天津市电力公司,国家电网有限公司
- 当前专利权人: 国网天津市电力公司电力科学研究院,国网天津市电力公司,国家电网有限公司
- 当前专利权人地址: 天津市西青区海泰华科四路8号; ;
- 代理机构: 天津盛理知识产权代理有限公司
- 代理商 王来佳
- 主分类号: G05B13/02
- IPC分类号: G05B13/02 ; G05B13/04 ; G06N3/08
摘要:
本发明涉及一种基于深度强化学习的电网实时自适应决策方法,包括如下步骤:步骤1、将新型电力系统机组自适应调度问题建模为马尔科夫决策过程;步骤2、研究SAC算法的基础原理,求解使得步骤1中MDP模型累计奖励值最大的策略;步骤3、设计基于IL中行为克隆的神经网络预训练方案,模拟专家经验,优化原始动作空间,提出IL‑SAC算法,并基于IL‑SAC算法以及105个真实电网场景数据训练相应的电网优化调度智能体,在测试时该智能体应对不同的电网场景数据能够输出实时决策方案,实现新型电网系统的智能调控。本发明能够实时地输出电网调度策略。
公开/授权文献
- CN114217524B 一种基于深度强化学习的电网实时自适应决策方法 公开/授权日:2024-03-19