一种基于强化学习的需求响应动态优化方法

发明公开

CN115860371A 一种基于强化学习的需求响应动态优化方法审中-实审

请登陆查看更多内容

专利标题： 一种基于强化学习的需求响应动态优化方法
申请号： CN202211488676.0

申请日： 2022-11-25
公开(公告)号： CN115860371A

公开(公告)日： 2023-03-28
发明人: 赵清松 , 戈阳阳 , 张潇桐 , 张强 , 王超 , 张冠锋 , 谢赐戬 , 白雪 , 付尧 , 齐全 , 巩晓伟 , 孙俊杰
申请人： 辽宁东科电力有限公司
申请人地址： 辽宁省沈阳市浑南新区新果街3-1号
专利权人： 辽宁东科电力有限公司
当前专利权人： 辽宁东科电力有限公司
当前专利权人地址： 辽宁省沈阳市浑南新区新果街3-1号
代理机构： 沈阳杰克知识产权代理有限公司
代理商 王洋
主分类号： G06Q10/0631
IPC分类号： G06Q10/0631 ; G06Q50/06 ; H02J3/00 ; G06Q10/04

摘要：

一种基于强化学习的需求响应动态优化方法，其步骤为：1)建立售电商和用户的需求响应模型；2)通过建立用户舒适成本函数的前后联系，构建出售电商动态优化收益函数；3)利用用户的需求响应收益函数确定其响应负荷；4)将售电商当前需求响应的收益函数转化为立即奖励函数；5)采用BP神经网络构建强化学习的Q函数，采用迭代方法训练BP神经网络直到Q函数收敛；6)基于训练所得的BP神经网络，输入当前状态，即可得到最优响应负荷。本发明通过上述方法，解决了状态和动作空间过大导致的维数灾问题。

信息查询

中国专利公布公告

审查信息

Global Dossier

Espacenet