发明公开
- 专利标题: 基于强化学习的电网调控方法、装置、设备及介质
-
申请号: CN202410436489.0申请日: 2024-04-11
-
公开(公告)号: CN118336695A公开(公告)日: 2024-07-12
- 发明人: 刘幸蔚 , 宋旭日 , 李立新 , 刘金波 , 陈斌 , 王彦沣 , 於益军 , 万雄 , 李泽科 , 罗雅迪 , 齐晓琳 , 张大伟 , 范海威 , 杨楠 , 路轶 , 门德月 , 熊志杰 , 黄宇鹏 , 刘升 , 韩昳 , 张国芳 , 张风彬 , 邱成建 , 刘书弟 , 胡蓉
- 申请人: 中国电力科学研究院有限公司 , 国家电网有限公司 , 国网四川省电力公司 , 国网四川省电力公司电力科学研究院 , 国网福建省电力有限公司
- 申请人地址: 北京市海淀区清河小营东路15号; ; ; ;
- 专利权人: 中国电力科学研究院有限公司,国家电网有限公司,国网四川省电力公司,国网四川省电力公司电力科学研究院,国网福建省电力有限公司
- 当前专利权人: 中国电力科学研究院有限公司,国家电网有限公司,国网四川省电力公司,国网四川省电力公司电力科学研究院,国网福建省电力有限公司
- 当前专利权人地址: 北京市海淀区清河小营东路15号; ; ; ;
- 代理机构: 北京中巡通大知识产权代理有限公司
- 代理商 田洲
- 主分类号: H02J3/00
- IPC分类号: H02J3/00 ; G06Q10/0631 ; G06Q50/06 ; G06N3/092
摘要:
本发明属于电网调控技术领域,公开一种基于强化学习的电网调控方法、装置、设备及介质;所述方法,包括:从电网运行环境获取电网运行数据;根据电网运行数据获取自适应奖励反馈值R;根据电网运行数据和自适应奖励反馈值R,通过电网调控强化学习智能体,获得基于强化学习的电网动作策略;根据动作空间校验所述电网动作策略,并通过执行校验通过的电网动作策略更新电网运行数据。本发明综合考虑电网的安全性、经济性与低碳性要求,计算得到与电网运行状态相匹配的自适应奖励反馈值R,自适应奖励反馈值R与电网运行状态自适应,使强化学习的训练更容易满足调控需求;使智能体输出的动作策略与当前电网运行状态相匹配。