一种基于强化学习的分布式能源实时调度方法及系统

    公开(公告)号:CN117726133A

    公开(公告)日:2024-03-19

    申请号:CN202311852643.4

    申请日:2023-12-29

    摘要: 本发明公开了一种基于强化学习的分布式能源实时调度方法及系统,属于数据处理技术领域,方法包括:构建分布式能源实时调度的智能体,智能体包括:状态空间、动作空间以及奖励函数,状态空间包括能源状态;动作空间包括能源调度动作;奖励函数用于根据能源调度动作的实施效果,为智能体提供奖励或者惩罚;根据历史能源状态,基于长短时记忆神经网络,预测下一时刻的能源状态;根据下一时刻的能源状态预测值,在约束条件的约束下,基于改进的近端策略优化算法,确定下一时刻的调度动作;根据调度动作,向各个区域分配各个分布式能源设备产生的能源;根据能源调度动作的实施效果,通过奖励函数,为智能体提供奖励或者惩罚。