-
公开(公告)号:CN116306903A
公开(公告)日:2023-06-23
申请号:CN202211516697.9
申请日:2022-11-30
Applicant: 浙江浙能乐清发电有限责任公司 , 浙江浙能数字科技有限公司
Abstract: 本发明涉及一种面向多智能体强化学习能源系统的鲁棒对抗训练框架,包括:构造一个对抗智能体以生成对抗攻击,并建模为对抗性部分可观察的随机博弈系统;固定经过预训练的被害多智能体策略,训练一个最优的确定性对抗策略来产生有界扰动;固定最优的对抗攻击策略,通过对抗性训练提高最优攻击者下受害者策略的鲁棒性。本发明的有益效果是:本发明将对抗性攻击建模为一个基于单智能体强化学习的攻击对手,并学习得到考虑攻击约束的最强攻击策略。从数学上,将该问题构建为对抗马尔可夫博弈,并通过鲁棒对抗训练提高基于多智能体强化学习的综合能源管理系统的性能。