一种多微电网协同优化运行方法、装置、设备及介质
Abstract:
本发明提供了一种多微电网协同优化运行方法、装置、设备及介质,通过构建多微电网的状态空间S及动作空间A,其中每个微电网为一个智能体,状态空间S包括多个状态变量,每个智能体选择电储能作为动作空间A的动作变量;进一步构建多智能体深度强化学习奖励函数,通过奖励引导多智能体协同满足区域用电需求,其中,每个智能体的奖励函数包括自身的外购电量,以及含有其他智能体信息的分量,即区域整体的电量消耗。公开了包含各智能体用电消耗以及区域用电消耗的强化学习奖励函数,使得多智能体之间分享了电量消耗信息,从而通过奖励引导多智能体协同满足区域用电需求,以降低用能成本。
Patent Agency Ranking
0/0