一种计及博弈和隐性行为的用户不确定响应行为重构方法、装置及存储介质

    公开(公告)号:CN118505073A

    公开(公告)日:2024-08-16

    申请号:CN202410616657.4

    申请日:2024-05-17

    申请人: 河海大学

    摘要: 本发明公开了一种计及博弈和隐性行为的用户不确定响应行为重构方法、装置及存储介质,其包括获取用户的状态信息,输入到预先训练好的用户不确定响应行为重构模型,得到用户的响应行为;训练过程包括:获取服务商智能体和用户智能体,将用户的隐形行为建模为隐形行为智能体,并将用户不确定响应行为重构问题转化为模拟生成轨迹与真实历史轨迹之间距离最小化问题;基于三个智能体,构建包括生成器网络和判别器网络的MAGAIL架构;利用真实历史轨迹和调查问卷数据对生成器网络和判别器网络进行训练,得到用户不确定响应行为重构模型。本发明能够充分模拟服务商与用户之间存在的博弈行为,并考虑到用户隐性行为对用户响应行为不确定性的影响。

    一种基于MTMA-SAC算法的售电公司交易行为模拟方法、装置及存储介质

    公开(公告)号:CN118552309A

    公开(公告)日:2024-08-27

    申请号:CN202410505142.7

    申请日:2024-04-25

    申请人: 河海大学

    摘要: 本发明公开了一种基于MTMA‑SAC算法的售电公司交易行为模拟方法、装置及存储介质,属于电力市场交易技术领域。方法包括:获取实时现货市场与零售市场的基本参数及数据,以及预先构建的购售电联合策略优化模型;报价智能体与定价智能体作为决策者,分别基于实时现货市场与零售市场的基本参数及数据,将优化模型转化为马尔可夫决策过程;根据马尔可夫决策过程,构建基于完全合作的MTMA强化学习训练框架;采用MTMA‑SAC算法对训练框架进行求解,报价智能体与定价智能体分别模拟得到售电公司在分层电力市场中的策略报价以及实时定价。本发明通过充分考虑现货市场和零售市场之间的相互影响,以获得电力市场资源优化配置下的最优购售电联合策略。

    一种基于多任务深度强化学习的购售电联合策略优化方法

    公开(公告)号:CN116029415A

    公开(公告)日:2023-04-28

    申请号:CN202211340354.1

    申请日:2022-10-28

    申请人: 河海大学

    发明人: 徐弘升 王珂 吴峰

    摘要: 本发明公开了一种基于多任务深度强化学习的购售电联合策略优化方法,该方法将售电商购售电联合策略优化问题导入分层电力市场建模成马尔可夫决策模型,并分别定义马尔可夫决策模型的状态、动作和奖励函数;基于马尔可夫决策模型构建基于多任务学习机制的购售电联合策略优化深度强化学习求解框架;并采用多任务深度强化学习神经网络结构对求解框架进行求解,得到最优的负荷申报和零售电价联合策略。本发明充分考虑了售电商在现货市场做购电量决策和在零售市场做零售电价决策两个任务之间的相关性,构建了基于多任务学习机制的购售电联合策略优化深度强化学习求解框架,考虑两个任务之间天然的耦合性对两个任务的并行求解得到最优联合的策略。