一种投标决策和激励决策联合优化方法、系统、设备及存储介质
摘要:
本发明公开了一种投标决策和激励决策联合优化方法、系统、设备及存储介质,方法包括:建立电力辅助服务市场模型;基于电力辅助服务市场的模型,建立市场成员行为模型;基于市场成员行为模型,构建负荷削减投标和需求响应激励联合决策模型,并将所述联合决策模型规范为马尔可夫决策过程;基于所述联合决策模型及对应的马尔可夫决策过程,设计改进型反事实基线多智能体策略梯度算法,对负荷削减投标决策智能体和需求响应激励决策智能体进行联合同步训练,得到投标决策和激励决策联合优化模型,利用模型完成联合优化;本发明实现了负荷削减投标决策智能体和需求响应激励决策智能体的联合同步训练,提高了优化效果。
0/0