-
公开(公告)号:CN116738874A
公开(公告)日:2023-09-12
申请号:CN202310534464.X
申请日:2023-05-12
申请人: 珠江水利委员会珠江水利科学研究院
IPC分类号: G06F30/28 , G06F30/27 , G06N3/092 , G06N3/044 , G06F119/14 , G06F113/08
摘要: 本发明公开了一种基于Multi‑Agent PPO强化学习的闸泵群联合优化调度方法,该方法的步骤包括:构建基于排水分区的产汇流模型;构建一维河道非恒定流水动力模型;构造水网闸泵群实时调控指标系数,作为Multi‑Agent PPO强化学习的奖励反馈;构建面向水网闸泵群实时调控的Multi‑Agent PPO强化学习模型,对模型进行训练,基于调控指标系数更新强化学习模型的网络参数,输出最优调度规则,将水力状态与闸泵群调度方案决策对应匹配,输出当前状态的价值及当前状态所对应的闸泵群调度策略。本发明有效提升调控效果,大幅减少调度策略优化时间,可满足闸泵群联合优化调度对于模拟调控精度与计算时长的要求。
-
公开(公告)号:CN116738874B
公开(公告)日:2024-01-23
申请号:CN202310534464.X
申请日:2023-05-12
申请人: 珠江水利委员会珠江水利科学研究院
IPC分类号: G06F30/28 , G06F30/27 , G06N3/092 , G06N3/044 , G06F119/14 , G06F113/08
摘要: 本发明公开了一种基于Multi‑Agent PPO强化学习的闸泵群联合优化调度方法,该方法的步骤包括:构建基于排水分区的产汇流模型;构建一维河道非恒定流水动力模型;构造水网闸泵群实时调控指标系数,作为Multi‑Agent PPO强化学习的奖励反馈;构建面向水网闸泵群实时调控的Multi‑Agent PPO强化学习模型,对模型进行训练,基于调控指标系数更新强化学习模型的网络参数,输出最优调度规则,将水力状态与闸泵群调度方案决策对应匹配,输出当前状态的价值及当前状态所对应的闸泵群调度策略。本发明有效提升调控效果,大幅减少调度策略优化时间,(56)对比文件檀朝东;蔡振华;邓涵文;刘世界;秦鹏;王一兵;宋文容.基于强化学习的煤层气井螺杆泵排采参数智能决策.石油钻采工艺.2020,(第01期),67-74.
-