一种基于强化学习的需求响应动态优化方法
摘要:
一种基于强化学习的需求响应动态优化方法,其步骤为:1)建立售电商和用户的需求响应模型;2)通过建立用户舒适成本函数的前后联系,构建出售电商动态优化收益函数;3)利用用户的需求响应收益函数确定其响应负荷;4)将售电商当前需求响应的收益函数转化为立即奖励函数;5)采用BP神经网络构建强化学习的Q函数,采用迭代方法训练BP神经网络直到Q函数收敛;6)基于训练所得的BP神经网络,输入当前状态,即可得到最优响应负荷。本发明通过上述方法,解决了状态和动作空间过大导致的维数灾问题。
0/0