基于强化学习的电网调控方法、装置、设备及介质

发明公开

CN118336695A 基于强化学习的电网调控方法、装置、设备及介质审中-实审

请登陆查看更多内容

专利标题： 基于强化学习的电网调控方法、装置、设备及介质
申请号： CN202410436489.0

申请日： 2024-04-11
公开(公告)号： CN118336695A

公开(公告)日： 2024-07-12
发明人: 刘幸蔚 , 宋旭日 , 李立新 , 刘金波 , 陈斌 , 王彦沣 , 於益军 , 万雄 , 李泽科 , 罗雅迪 , 齐晓琳 , 张大伟 , 范海威 , 杨楠 , 路轶 , 门德月 , 熊志杰 , 黄宇鹏 , 刘升 , 韩昳 , 张国芳 , 张风彬 , 邱成建 , 刘书弟 , 胡蓉
申请人： 中国电力科学研究院有限公司 , 国家电网有限公司 , 国网四川省电力公司 , 国网四川省电力公司电力科学研究院 , 国网福建省电力有限公司
申请人地址： 北京市海淀区清河小营东路15号; ; ; ;
专利权人： 中国电力科学研究院有限公司,国家电网有限公司,国网四川省电力公司,国网四川省电力公司电力科学研究院,国网福建省电力有限公司
当前专利权人： 中国电力科学研究院有限公司,国家电网有限公司,国网四川省电力公司,国网四川省电力公司电力科学研究院,国网福建省电力有限公司
当前专利权人地址： 北京市海淀区清河小营东路15号; ; ; ;
代理机构： 北京中巡通大知识产权代理有限公司
代理商 田洲
主分类号： H02J3/00
IPC分类号： H02J3/00 ; G06Q10/0631 ; G06Q50/06 ; G06N3/092

摘要：

本发明属于电网调控技术领域，公开一种基于强化学习的电网调控方法、装置、设备及介质；所述方法，包括：从电网运行环境获取电网运行数据；根据电网运行数据获取自适应奖励反馈值R；根据电网运行数据和自适应奖励反馈值R，通过电网调控强化学习智能体，获得基于强化学习的电网动作策略；根据动作空间校验所述电网动作策略，并通过执行校验通过的电网动作策略更新电网运行数据。本发明综合考虑电网的安全性、经济性与低碳性要求，计算得到与电网运行状态相匹配的自适应奖励反馈值R，自适应奖励反馈值R与电网运行状态自适应，使强化学习的训练更容易满足调控需求；使智能体输出的动作策略与当前电网运行状态相匹配。

信息查询

中国专利公布公告 Global Dossier Espacenet

IPC分类:

H	电学
H02	发电、变电或配电
H02J	供电或配电的电路装置或系统；电能存储系统
H02J3/00	交流干线或交流配电网络的电路装置