基于物理模型与价值神经网络融合的经济调度决策方法
摘要:
本发明属于电力系统自动化技术领域,本发明提供了基于物理模型与价值神经网络融合的经济调度决策方法,首先,将电网经济调度的数学模型转换成受限马尔可夫决策过程模型,其次,基于动作空间的映射和松弛原理,将受限马尔可夫决策过程模型无约束马尔可夫决策过程模型,其中,所述无约束马尔可夫决策过程模型采用深度确定性策略梯度算法对深度强化学习智能体进行训练,得到所述电网经济调度的策略神经网络和价值神经网络,最后,以所述价值神经网络最高估值为指导,利用所述策略神经网络输出所述电网经济调度的最优策略,实现所述电网经济调度。本发明能够快速、准确地训练出电网经济调度智能体,生成满足电网安全稳定运行要求的有功调度策略。
0/0