一种基于强化学习的风蓄生态发电日随机优化调度方法
摘要:
本发明涉及一种基于强化学习的风蓄生态发电日随机优化调度方法,包括:预先构建目标函数,所述目标函数以风电‑抽蓄联合系统实际出力与计划出力偏差平方的期望值最小为目标;获取当前风电出力实际值和风电出力预测值;利用Q(λ)‑learning算法迭代求解目标函数,得到调度策略:将当前水库容量作为状态初始值,利用启发式贪婪策略在水库进出流量集中选取动作,利用资格迹函数提取动作资格,利用启发函数提取动作的启发信息;计算执行当前动作的奖励值并更新Q值,得到Q值表;根据Q值表确定调度策略。
0/0