基于强化学习的充放电策略网络训练方法和储能控制方法
Abstract:
本说明书实施例提供基于强化学习的充放电策略网络训练方法和储能控制方法,包括构建充放电序贯决策模型;获取第k时间段的用电单价、用户电力负荷以及储能电池的荷电状态作为第k时间段的状态;根据第k时间段的状态、充放电序贯决策模型确定第k时间段储能电池的充放电功率动作;根据第k时间段的充放电功率动作和预先设置的奖励函数计算得到第k时间段的奖励,奖励函数包括效益奖励、退化奖励和负荷均衡奖励;利用第k时间段的奖励训练模型直至训练完成得到充放电策略网络。本方法基于强化学习构建了充放电序贯决策模型并设计了考虑了储能电池性能退化因素的奖励函数,充分利用了储能电池削峰填谷的能力,减少了电池容量损失和能源损失。
Patent Agency Ranking
0/0