一种求解储能参与削峰填谷的优化调度方法和系统
摘要:
本发明提供了一种求解储能参与削峰填谷的优化调度方法和系统,包括设置参数化的深度Q值网络,利用负荷历史数据以及对应时刻储能的功率出率对参数化的深度Q值网络进行训练,训练过程中利用信赖域优化模型对控制策略的更新次数做出限制,从而快速准确的获取最优策略,以便在当前条件下实现储能的优化调度控制。本发明利用信赖域‑强化学习,在连续控制中,对策略更新的大小做出限制,每次更新的时候不大幅度地改变分布的形态,使收益满足调递增收敛性,能够在线修正优化结果,并且考虑到充放电约束,达到最优的削峰填谷控制功能。
0/0