一种基于深度强化学习的操作票操作顺序智能生成方法

发明公开

CN113128753A 一种基于深度强化学习的操作票操作顺序智能生成方法审中-实审

请登陆查看更多内容

专利标题： 一种基于深度强化学习的操作票操作顺序智能生成方法
申请号： CN202110311709.3

申请日： 2021-03-24
公开(公告)号： CN113128753A

公开(公告)日： 2021-07-16
发明人: 周凯 , 喻鑫 , 严利雄 , 林瑨 , 毕如玉 , 杜勇 , 邓科 , 胡志坚 , 刘晓华 , 刘磊
申请人： 国网湖北省电力有限公司检修公司 , 武汉大学
申请人地址： 湖北省武汉市汉阳区五里墩二合村60-65号;
专利权人： 国网湖北省电力有限公司检修公司,武汉大学
当前专利权人： 国网湖北省电力有限公司检修公司,武汉大学
当前专利权人地址： 湖北省武汉市汉阳区五里墩二合村60-65号;
代理机构： 武汉楚天专利事务所
代理商 孔敏
主分类号： G06Q10/04
IPC分类号： G06Q10/04 ; G06Q50/06 ; G06F30/27 ; G06N3/00 ; G06N3/04 ; G06N3/08 ; G06F113/04

摘要：

本发明提供一种基于深度强化学习的操作票操作顺序智能生成方法，首先使用“断路器刀闸组”和“设备刀闸组”的概念对电力网络进行建模，其次根据电力安全制度建立智能算法的网络评估函数、立即回报函数，使用深度强化学习算法建立操作顺序学习智能体，根据操作员选择的操作任务，确定网络评估函数和立即回报函数的相关参数，操作顺序学习智能体通过深度强化学习然后输出操作顺序，再由操作员审核并决定是否需要修改，然后成为正式操作顺序。本发明基于随机方差减小的DDPG算法(SVRG‑DDPG)智能生成操作票操作顺序，可开出高准确率的满足电网调度需要的操作票。

信息查询

中国专利公布公告 Global Dossier Espacenet

IPC分类:

G	物理
G06	计算；推算或计数
G06Q	专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法；其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10/00	行政；管理
G06Q10/04	.预测或优化，例如线性规划、“旅行商问题”或“下料问题”