基于深度确定性策略梯度算法的发电商智能体及报价方法
摘要:
本发明公开了一种基于深度确定性策略梯度算法的发电商智能体及报价方法,智能体包括:深度确定性策略梯度算法网络构建模块,用于建立由深度Actor网络、深度Critic网络以及由Experience Replay memory构成的经验回放库;探索性报价动作生成模块,用于建立发电商在电能的市场竞价模型,并根据建立的市场竞价模型基于Current Actor Network计算的结果选择报价动作,将发电商的报价提交给ISO进行出清,将本次出清对应的发电商智能体的当前状态、报价系数、奖励和新的状态储存到Experience Replay memory中。本发明通过深度强化学习的方法寻找发电商在非完全信息下的动态报价策略,是一种高效的报价决策工具,有助于发电商更加准确地在电力市场进行报价。
0/0