能源互联网的协同优化决策方法、系统、设备及存储介质

    公开(公告)号:CN114977326A

    公开(公告)日:2022-08-30

    申请号:CN202210706842.3

    申请日:2022-06-21

    IPC分类号: H02J3/46 H02J3/48 H02J3/50

    摘要: 一种能源互联网的协同优化决策方法、系统、设备及存储介质,方法包括设置奖励机制寻找最优策略,以最优策略作为智能体深度强化学习的训练目标,对区域能源互联网运行优化模型进行求解,得到最优解作为动作策略;智能体根据能源互联网当前的运行状态,取相似性度量最小值所对应运行状态的动作策略作为深度强化学习训练的初值进行训练,给出训练后相应的动作策略;将动作策略传递给环境后,运行状态过渡到下一时刻的状态,通过设置的奖励机制和动作约束条件,给予动作策略的好坏进行相应奖励,通过迭代训练,得到深度强化学习模型;利用深度强化学习模型基于运行状态相似度对各时刻动作协同优化决策。本发明能够实现能源互联网的快速精准优化调度。