电网有功控制智能体的仿真训练方法、装置及设备
摘要:
本发明公开了一种电网有功控制智能体的仿真训练方法、装置及设备,涉及电力系统仿真技术领域,可解决目前深度强化学习训练的智能体无法适用于实际电网模型拓扑结构的问题。其中方法包括:获取基于深度强化学习构建的智能体,基于实际电网模型拓扑结构与历史运行数据构建电网仿真环境,在电网仿真环境中,获取电网设备至少一组初始状态数据,训练智能体,生成初始有功控制动作策略;若初始有功控制动作策略满足预设校验条件,根据初始有功控制动作策略更新初始状态数据,得到下一状态数据;根据初始状态数据与下一状态数据计算得到初始动作奖励值,利用下一状态数据与初始动作奖励值继续训练智能体,直到达到预设停止条件,得到训练完成的智能体。
0/0