-
公开(公告)号:CN119009988A
公开(公告)日:2024-11-22
申请号:CN202411108347.8
申请日:2024-08-13
Applicant: 中国电力科学研究院有限公司 , 国网福建省电力有限公司 , 国家电网有限公司 , 国网四川省电力公司 , 国网冀北电力有限公司
Inventor: 杨楠 , 李昕航 , 李立新 , 黄宇鹏 , 刘金波 , 董亮 , 刘幸蔚 , 张喆钧 , 宋旭日 , 李蕾 , 於益军 , 万雄 , 穆永铮 , 李泽科 , 王彦沣 , 宋磊 , 马晓忱 , 范海威 , 齐晓琳 , 叶希 , 韩昳 , 王凯 , 陈郑平 , 张风彬 , 朱童 , 徐新智 , 张国芳 , 邱成建
IPC: H02J3/00 , G06Q10/0631 , G06Q50/06 , G06Q10/04 , G06N3/045 , G06N3/0475 , G06N3/094 , G06N3/092 , G06N3/084
Abstract: 本发明属于电网调度领域,公开了一种电网优化调度方法及相关装置,包括:获取电网的当前运行状态;将电网的当前运行状态,输入至预训练的基于多对抗强化学习的电网优化调度模型,得到电网的当前运行状态调整动作;其中,基于多对抗强化学习的电网优化调度模型通过将深度确定性动作梯度模型中评论家网络在训练时的目标Q值修改为即时奖励和电网未来潜在奖励预测值之和得到;其中,电网未来潜在奖励预测值采用预训练的生成式多对抗网络模型预测得到。引入生成式多对抗网络模型替代目标网络对未来全部决策时刻内运行状态进行预感知,弥补传统强化学习中评估网络仅对下一步目标收益评估拟合的缺点,更好地适应电网波动的情况。