基于联邦强化学习的综合能源系统优化调度方法及系统
摘要:
本发明公开了基于联邦强化学习的综合能源系统优化调度方法及系统,包括在配电网区域内划分若干分布式智能体;设计每个分布式智能体对应的本地模型;对各本地模型进行训练得到对应的状态值数据、动作值数据和奖励值数据;对各本地模型参数进行保护和隐私处理;根据状态值、动作值和奖励值数据,进行Actor网络和Critic网络的训练并将训练好的模型参数上传至联邦服务器;基于联邦平均算法更新全局模型参数并下发,以供对应的各本地模型在下一轮训练中使用;在满足条件时完成训练。本发明提供的基于联邦强化学习的综合能源系统优化调度方法及系统,将联邦学习与强化学习相结合,智能体在学习中既通过交换经验和模型参数来共同提升性能,又保护了数据的隐私。
0/0