基于历史调控经验的时间窗口迁移强化学习注采优化方法

    公开(公告)号:CN116663654A

    公开(公告)日:2023-08-29

    申请号:CN202310942706.9

    申请日:2023-07-31

    摘要: 本发明公开了一种基于历史调控经验的时间窗口迁移强化学习注采优化方法,属于油藏注采技术领域,包括如下步骤:步骤1、确定当前油藏目标任务时间窗口的优化井数和优化时间步;步骤2、获取现有源模型,冻结源模型中的特征提取层权重进行目标智能体的初始化操作;步骤3、通过梯度反向传播的方式训练得到最优目标智能体,完成目标模型的构建;步骤4、基于目标模型,读取当前油藏的状态信息,得到完整的生产制度,实现实时注采优化。本发明结合强化学习算法,借鉴源模型通过策略迁移,实现新时间窗口的快速优化,减少所需的数值模拟迭代次数。

    一种基于安全强化学习的油藏约束注采优化方法

    公开(公告)号:CN118734722A

    公开(公告)日:2024-10-01

    申请号:CN202411225200.7

    申请日:2024-09-03

    摘要: 本发明公开了一种基于安全强化学习的油藏约束注采优化方法,属于油藏约束注采优化技术领域,包括如下步骤:构建油藏注采比约束注采优化模型和油藏注采比约束马尔可夫决策过程;基于WCSAC安全强化学习算法,构建油藏注采比约束注采调控强化学习智能体模型;智能体与油藏数值模拟持续交互,采集数据样本并存储到经验回放缓冲区中;训练奖励评论家网络、安全评论家网络、策略网络,直到达到最大训练回合轮次;利用训练完成的策略网络输出当前状态下最优的生产制度。本发明的强化学习方法能够在满足油藏注采比约束的前提下,根据油藏当前状态设计最优注采方案,实现油藏安全稳定生产,具有较好的科学和实际应用价值。