一种基于深度Q学习的梯级水库随机优化调度方法

    公开(公告)号:CN110930016A

    公开(公告)日:2020-03-27

    申请号:CN201911134887.2

    申请日:2019-11-19

    申请人: 三峡大学

    摘要: 一种基于深度Q学习的梯级水库随机优化调度方法,包括描述水库的入库径过程:建立马尔科夫决策过程MDPS模型;建立概率转移矩阵:建立梯级水库随机优化调度模型;确定模型的约束函数:引入深度神经网络,提取梯级水库径流状态特征,同时实现对调度模型的目标值函数进行近似表示和优化;将强化学习运用到水库随机优化调度中;建立DQN模型;采用深度强化学习算法,求解梯级水库随机优化调度模型。本发明一种基于深度Q学习的梯级水库随机优化调度方法,实现了梯级水库随机优化调度,使得在调度期内充分利用发电机组,用电需求和各种约束条件得到满足,年平均发电收益最大。

    一种基于水库生态发电多目标中长期随机调度模型的优化调度方法

    公开(公告)号:CN112036633B

    公开(公告)日:2021-06-04

    申请号:CN202010871614.2

    申请日:2020-08-26

    申请人: 三峡大学

    摘要: 本发明提供了一种水库生态发电多目标中长期随机调度模型的构建方法以及优化调度方法,本发明采用Tennant法中的理想生态流量。优化调度模型的建立包括:首先建立水库发电目标函数以及生态流量贴近度目标函数,紧接着通过这两个目标函数归一化处理得到发电和生态综合效益的多目标函数,尽量使得发电和生态综合效益最大。接着描述水库生态随机调度模型的约束条件,然后将径流随机过程和随机变量的马尔可夫决策过程引入水库生态发电中长期随机优化调度问题中。Q‑learning算法是一种可以确定最优决策策略的强化学习算法,无需环境模型,可以充分利用和挖掘水库入库径流数据,实现水库经济效益和生态效益的统一。

    一种梯级水库生态发电多目标中长期随机调度模型的构建方法以及优化调度方法

    公开(公告)号:CN112036632A

    公开(公告)日:2020-12-04

    申请号:CN202010870395.6

    申请日:2020-08-26

    申请人: 三峡大学

    IPC分类号: G06Q10/04 G06Q10/06 G06Q50/06

    摘要: 本发明提供了一种梯级水库生态发电多目标中长期随机调度模型的构建方法以及优化调度方法,包括以下步骤:1.对于梯级水库的随机入库径流进行分析,并采用生态需水等级指数法计算出适宜生态流量作为生态流量基准值;2.建立梯级水库生态发电多目标中长期优化调度模型,其包括梯级水库发电量贴近度目标函数、生态流量贴近度目标函数和约束条件;3.采用强化学习SARSA算法在不同随机入库径流场景下对模型进行求解学习,并引入启发函数和效用迹函数对算法的精度和求解速度进行改进;4.根据算法学习到的调度规则,得出满足生态发电综合贴近度最大的梯级水库中长期调度方案。本发明提高了水资源的综合利用效益,改善了调度效果。

    基于SARSA(λ)算法的风电-抽蓄联合系统日随机动态调度方法

    公开(公告)号:CN112054561B

    公开(公告)日:2022-06-14

    申请号:CN202010973224.6

    申请日:2020-09-16

    申请人: 三峡大学

    摘要: 本发明提供了基于SARSA(λ)算法的风电‑抽蓄联合系统日随机动态调度方法,具体如下:首先考虑风电出力的随机性,并用Beta分布来表示风电出力的概率分布;其次建立考虑分时电价的风电‑抽蓄联合系统日随机动态调度模型;最后将强化学习中多步时序差分的SARSA(λ)算法引入到模型求解中,通过历史场景数据进行学习,不断试错积累经验。该方法为解决考虑随机性的风蓄联合优化调度这类多阶段决策问题提供了新的思路,在获得优化调度目标的同时,提高了求解效率。

    一种基于梯级水库生态发电多目标中长期随机调度模型的优化调度方法

    公开(公告)号:CN112036632B

    公开(公告)日:2021-06-04

    申请号:CN202010870395.6

    申请日:2020-08-26

    申请人: 三峡大学

    IPC分类号: G06Q10/04 G06Q10/06 G06Q50/06

    摘要: 本发明提供了一种梯级水库生态发电多目标中长期随机调度模型的构建方法以及优化调度方法,包括以下步骤:1.对于梯级水库的随机入库径流进行分析,并采用生态需水等级指数法计算出适宜生态流量作为生态流量基准值;2.建立梯级水库生态发电多目标中长期优化调度模型,其包括梯级水库发电量贴近度目标函数、生态流量贴近度目标函数和约束条件;3.采用强化学习SARSA算法在不同随机入库径流场景下对模型进行求解学习,并引入启发函数和效用迹函数对算法的精度和求解速度进行改进;4.根据算法学习到的调度规则,得出满足生态发电综合贴近度最大的梯级水库中长期调度方案。本发明提高了水资源的综合利用效益,改善了调度效果。

    基于SARSA(λ)算法的风电-抽蓄联合系统日随机动态调度方法

    公开(公告)号:CN112054561A

    公开(公告)日:2020-12-08

    申请号:CN202010973224.6

    申请日:2020-09-16

    申请人: 三峡大学

    摘要: 本发明提供了基于SARSA(λ)算法的风电‑抽蓄联合系统日随机动态调度方法,具体如下:首先考虑风电出力的随机性,并用Beta分布来表示风电出力的概率分布;其次建立考虑分时电价的风电‑抽蓄联合系统日随机动态调度模型;最后将强化学习中多步时序差分的SARSA(λ)算法引入到模型求解中,通过历史场景数据进行学习,不断试错积累经验。该方法为解决考虑随机性的风蓄联合优化调度这类多阶段决策问题提供了新的思路,在获得优化调度目标的同时,提高了求解效率。

    一种水库生态发电多目标中长期随机调度模型的构建方法以及优化调度方法

    公开(公告)号:CN112036633A

    公开(公告)日:2020-12-04

    申请号:CN202010871614.2

    申请日:2020-08-26

    申请人: 三峡大学

    摘要: 本发明提供了一种水库生态发电多目标中长期随机调度模型的构建方法以及优化调度方法,本发明采用Tennant法中的理想生态流量。优化调度模型的建立包括:首先建立水库发电目标函数以及生态流量贴近度目标函数,紧接着通过这两个目标函数归一化处理得到发电和生态综合效益的多目标函数,尽量使得发电和生态综合效益最大。接着描述水库生态随机调度模型的约束条件,然后将径流随机过程和随机变量的马尔可夫决策过程引入水库生态发电中长期随机优化调度问题中。Q-learning算法是一种可以确定最优决策策略的强化学习算法,无需环境模型,可以充分利用和挖掘水库入库径流数据,实现水库经济效益和生态效益的统一。