发明公开
- 专利标题: 基于物理模型与价值神经网络融合的经济调度决策方法
-
申请号: CN202410062074.1申请日: 2024-01-16
-
公开(公告)号: CN117974185A公开(公告)日: 2024-05-03
- 发明人: 王淼 , 李立新 , 李理 , 吕闫 , 孙博 , 石上丘 , 孙略 , 於益军 , 罗雅迪 , 张印 , 田曦晨 , 郎燕生 , 马晓忱 , 王少芳 , 曾沅 , 任郡枝 , 胡雨卓 , 曹皓森
- 申请人: 中国电力科学研究院有限公司 , 天津大学
- 申请人地址: 北京市海淀区清河小营东路15号;
- 专利权人: 中国电力科学研究院有限公司,天津大学
- 当前专利权人: 中国电力科学研究院有限公司,天津大学
- 当前专利权人地址: 北京市海淀区清河小营东路15号;
- 代理机构: 广东盛知知识产权代理事务所
- 代理商 赵海鹏
- 主分类号: G06Q30/0201
- IPC分类号: G06Q30/0201 ; G06Q50/06 ; G06F18/20 ; G06N3/092 ; H02J3/00
摘要:
本发明属于电力系统自动化技术领域,本发明提供了基于物理模型与价值神经网络融合的经济调度决策方法,首先,将电网经济调度的数学模型转换成受限马尔可夫决策过程模型,其次,基于动作空间的映射和松弛原理,将受限马尔可夫决策过程模型无约束马尔可夫决策过程模型,其中,所述无约束马尔可夫决策过程模型采用深度确定性策略梯度算法对深度强化学习智能体进行训练,得到所述电网经济调度的策略神经网络和价值神经网络,最后,以所述价值神经网络最高估值为指导,利用所述策略神经网络输出所述电网经济调度的最优策略,实现所述电网经济调度。本发明能够快速、准确地训练出电网经济调度智能体,生成满足电网安全稳定运行要求的有功调度策略。