基于强化学习的电网调控方法、装置、设备及介质
摘要:
本发明属于电网调控技术领域,公开一种基于强化学习的电网调控方法、装置、设备及介质;所述方法,包括:从电网运行环境获取电网运行数据;根据电网运行数据获取自适应奖励反馈值R;根据电网运行数据和自适应奖励反馈值R,通过电网调控强化学习智能体,获得基于强化学习的电网动作策略;根据动作空间校验所述电网动作策略,并通过执行校验通过的电网动作策略更新电网运行数据。本发明综合考虑电网的安全性、经济性与低碳性要求,计算得到与电网运行状态相匹配的自适应奖励反馈值R,自适应奖励反馈值R与电网运行状态自适应,使强化学习的训练更容易满足调控需求;使智能体输出的动作策略与当前电网运行状态相匹配。
0/0