一种基于智能电网的多智能体深度强化学习代理方法
摘要:
本发明适用于电力自动化控制技术领域,提供了一种基于智能电网的多智能体深度强化学习代理方法,包括:S1、根据选择的动作得到的奖励计算本次状态下对应的动作标准值对神经网络的参数进行更新;S2、根据消费者和生产者的种类建立“外部竞争,内部合作”的多智能体代理;S3、根据智能体的动作的利润最大化和其他内部智能体的利益设置每个内部智能体的奖励函数。神经网络的输入层可以接受刻画状态的特征的值的直接输入,而Q‑table需要将特征值离散化来减小状态空间。
0/0