一种基于深度强化学习的操作票操作顺序智能生成方法
摘要:
本发明提供一种基于深度强化学习的操作票操作顺序智能生成方法,首先使用“断路器刀闸组”和“设备刀闸组”的概念对电力网络进行建模,其次根据电力安全制度建立智能算法的网络评估函数、立即回报函数,使用深度强化学习算法建立操作顺序学习智能体,根据操作员选择的操作任务,确定网络评估函数和立即回报函数的相关参数,操作顺序学习智能体通过深度强化学习然后输出操作顺序,再由操作员审核并决定是否需要修改,然后成为正式操作顺序。本发明基于随机方差减小的DDPG算法(SVRG‑DDPG)智能生成操作票操作顺序,可开出高准确率的满足电网调度需要的操作票。
0/0