一种基于安全强化学习的油藏约束注采优化方法

    公开(公告)号:CN118734722A

    公开(公告)日:2024-10-01

    申请号:CN202411225200.7

    申请日:2024-09-03

    摘要: 本发明公开了一种基于安全强化学习的油藏约束注采优化方法,属于油藏约束注采优化技术领域,包括如下步骤:构建油藏注采比约束注采优化模型和油藏注采比约束马尔可夫决策过程;基于WCSAC安全强化学习算法,构建油藏注采比约束注采调控强化学习智能体模型;智能体与油藏数值模拟持续交互,采集数据样本并存储到经验回放缓冲区中;训练奖励评论家网络、安全评论家网络、策略网络,直到达到最大训练回合轮次;利用训练完成的策略网络输出当前状态下最优的生产制度。本发明的强化学习方法能够在满足油藏注采比约束的前提下,根据油藏当前状态设计最优注采方案,实现油藏安全稳定生产,具有较好的科学和实际应用价值。