一种基于改进Q学习惩罚选择的微电网优化调度方法
摘要:
本发明涉及一种基于改进Q学习惩罚选择的微电网优化调度方法,包括如下步骤:步骤1:以微电网内部常规机组运行成本、环境效益成本、大电网功率交互成本构建目标函数;步骤2:建立微电网运行的约束条件;步骤3:构造以最高弃风弃光成本与风光完全消纳成本的为最高与最低阈值的惩罚回报函数;步骤4:采用多元宇宙优化算法改进传统Q学习算法;步骤5:将步骤1所得目标函数进行马尔科夫决策描述处理,并以改进的Q学习算法对所得状态与空间描述进行规划求解。本发明降低了微电网运行调度中可再生能源的弃用率,减少了微电网与大电网能量交互的波动性,解决了传统优化方法响应慢、不收敛的问题,提升了微电网运行的稳定性与经济性。
0/0