一种基于多任务深度强化学习的购售电联合策略优化方法
摘要:
本发明公开了一种基于多任务深度强化学习的购售电联合策略优化方法,该方法将售电商购售电联合策略优化问题导入分层电力市场建模成马尔可夫决策模型,并分别定义马尔可夫决策模型的状态、动作和奖励函数;基于马尔可夫决策模型构建基于多任务学习机制的购售电联合策略优化深度强化学习求解框架;并采用多任务深度强化学习神经网络结构对求解框架进行求解,得到最优的负荷申报和零售电价联合策略。本发明充分考虑了售电商在现货市场做购电量决策和在零售市场做零售电价决策两个任务之间的相关性,构建了基于多任务学习机制的购售电联合策略优化深度强化学习求解框架,考虑两个任务之间天然的耦合性对两个任务的并行求解得到最优联合的策略。
0/0