发明公开
- 专利标题: 基于深度确定性策略梯度算法的发电商智能体及报价方法
-
申请号: CN202011573875.2申请日: 2020-12-25
-
公开(公告)号: CN112598473A公开(公告)日: 2021-04-02
- 发明人: 朱炳铨 , 肖艳炜 , 李继红 , 项中明 , 孙珂 , 徐立中 , 裘雨音 , 孔飘红 , 黄志华 , 申建强 , 王高琴 , 史新红 , 郑亚先 , 杨争林 , 冯树海 , 王子恒
- 申请人: 国网浙江省电力有限公司 , 中国电力科学研究院有限公司 , 国家电网有限公司 , 国网浙江省电力有限公司湖州供电公司
- 申请人地址: 浙江省杭州市西湖区黄龙路8号; ; ;
- 专利权人: 国网浙江省电力有限公司,中国电力科学研究院有限公司,国家电网有限公司,国网浙江省电力有限公司湖州供电公司
- 当前专利权人: 国网浙江省电力有限公司,中国电力科学研究院有限公司,国家电网有限公司,国网浙江省电力有限公司湖州供电公司
- 当前专利权人地址: 浙江省杭州市西湖区黄龙路8号; ; ;
- 代理机构: 北京中巡通大知识产权代理有限公司
- 代理商 李晓晓
- 主分类号: G06Q30/06
- IPC分类号: G06Q30/06 ; G06Q30/08 ; G06Q50/06 ; G06N3/04 ; G06N3/08
摘要:
本发明公开了一种基于深度确定性策略梯度算法的发电商智能体及报价方法,智能体包括:深度确定性策略梯度算法网络构建模块,用于建立由深度Actor网络、深度Critic网络以及由Experience Replay memory构成的经验回放库;探索性报价动作生成模块,用于建立发电商在电能的市场竞价模型,并根据建立的市场竞价模型基于Current Actor Network计算的结果选择报价动作,将发电商的报价提交给ISO进行出清,将本次出清对应的发电商智能体的当前状态、报价系数、奖励和新的状态储存到Experience Replay memory中。本发明通过深度强化学习的方法寻找发电商在非完全信息下的动态报价策略,是一种高效的报价决策工具,有助于发电商更加准确地在电力市场进行报价。