一种基于约束感知强化学习的综合储能系统优化方法
Abstract:
本发明涉及一种基于约束感知强化学习的综合储能系统优化方法,包括:构建Q值网络,所述Q值网络包括若干神经单元,所述神经单元的激活函数为RELU函数;将燃气轮机组输出功率和储能机组输出功率作为动作,将风电系统输出功率、负载功率、储能系统荷电状态作为状态,将燃气轮机组运营成本、售购电成本和功率不平衡量作为惩罚项建立奖励函数,训练Q值网络得到Q值网络的最优参数;将固定Q值网络参数,将Q值网络转换为混合整数规划模型,所述混合整数规划模型设有微电网约束条件;输入当前状态至混合整数规划模型,通过gurobi求解器求解混合整数规划模型,得到最优动作即能源调度方案。
Patent Agency Ranking
0/0