基于多智能体宽大强化学习的电力安全经济调度方法

    公开(公告)号:CN114386331B

    公开(公告)日:2024-09-06

    申请号:CN202210043886.2

    申请日:2022-01-14

    摘要: 本发明公开了基于多智能体宽大强化学习的电力安全经济调度方法。针对智能电网规模的不断扩张,设计了多智能体宽大强化学习解决框架,采用深度学习拟合状态‑动作价值曲线,并融入了经验池,可以普遍应用于电力系统的分布式经济调度。针对新能源发电单元与网络干扰带来的成本函数不确定性问题,引入宽大强化学习的奖励空间拟合机制,消除智能体与环境交互过程中的不确定性奖励。采用信誉值评估各个智能体的安全状态,应对多智能体系统可能遇到的网络攻击问题,并通过信誉值更新网络通信权重,实现不安全节点的隔离。本发明实现了智能电网多发电机组分布式经济调度问题的联合求解,为复杂电网发电单元的安全、可靠、高效的调度提供可行的方案。