发明公开
- 专利标题: 一种基于强化学习的需求响应动态优化方法
-
申请号: CN202211488676.0申请日: 2022-11-25
-
公开(公告)号: CN115860371A公开(公告)日: 2023-03-28
- 发明人: 赵清松 , 戈阳阳 , 张潇桐 , 张强 , 王超 , 张冠锋 , 谢赐戬 , 白雪 , 付尧 , 齐全 , 巩晓伟 , 孙俊杰
- 申请人: 辽宁东科电力有限公司
- 申请人地址: 辽宁省沈阳市浑南新区新果街3-1号
- 专利权人: 辽宁东科电力有限公司
- 当前专利权人: 辽宁东科电力有限公司
- 当前专利权人地址: 辽宁省沈阳市浑南新区新果街3-1号
- 代理机构: 沈阳杰克知识产权代理有限公司
- 代理商 王洋
- 主分类号: G06Q10/0631
- IPC分类号: G06Q10/0631 ; G06Q50/06 ; H02J3/00 ; G06Q10/04
摘要:
一种基于强化学习的需求响应动态优化方法,其步骤为:1)建立售电商和用户的需求响应模型;2)通过建立用户舒适成本函数的前后联系,构建出售电商动态优化收益函数;3)利用用户的需求响应收益函数确定其响应负荷;4)将售电商当前需求响应的收益函数转化为立即奖励函数;5)采用BP神经网络构建强化学习的Q函数,采用迭代方法训练BP神经网络直到Q函数收敛;6)基于训练所得的BP神经网络,输入当前状态,即可得到最优响应负荷。本发明通过上述方法,解决了状态和动作空间过大导致的维数灾问题。