-
公开(公告)号:CN115001002A
公开(公告)日:2022-09-02
申请号:CN202210916196.3
申请日:2022-08-01
申请人: 广东电网有限责任公司肇庆供电局
摘要: 本发明提供了一种求解储能参与削峰填谷的优化调度方法和系统,包括设置参数化的深度Q值网络,利用负荷历史数据以及对应时刻储能的功率出率对参数化的深度Q值网络进行训练,训练过程中利用信赖域优化模型对控制策略的更新次数做出限制,从而快速准确的获取最优策略,以便在当前条件下实现储能的优化调度控制。本发明利用信赖域‑强化学习,在连续控制中,对策略更新的大小做出限制,每次更新的时候不大幅度地改变分布的形态,使收益满足调递增收敛性,能够在线修正优化结果,并且考虑到充放电约束,达到最优的削峰填谷控制功能。
-
公开(公告)号:CN115001002B
公开(公告)日:2022-12-30
申请号:CN202210916196.3
申请日:2022-08-01
申请人: 广东电网有限责任公司肇庆供电局
摘要: 本发明提供了一种求解储能参与削峰填谷的优化调度方法和系统,包括设置参数化的深度Q值网络,利用负荷历史数据以及对应时刻储能的功率出率对参数化的深度Q值网络进行训练,训练过程中利用信赖域优化模型对控制策略的更新次数做出限制,从而快速准确的获取最优策略,以便在当前条件下实现储能的优化调度控制。本发明利用信赖域‑强化学习,在连续控制中,对策略更新的大小做出限制,每次更新的时候不大幅度地改变分布的形态,使收益满足调递增收敛性,能够在线修正优化结果,并且考虑到充放电约束,达到最优的削峰填谷控制功能。
-