一种基于强化学习的数据中心机房的控制方法及装置

    公开(公告)号:CN118625661A

    公开(公告)日:2024-09-10

    申请号:CN202410656749.5

    申请日:2024-05-24

    Abstract: 本说明书涉及数据中心技术领域,提供了一种基于强化学习的数据中心机房的控制方法及装置。所述方法包括:根据数据中心模拟机房中的每一空调单元的状态,及空调单元的临近设备的状态,为每一空调单元建立状态转换模型;将数据中心模拟机房中所有空调单元的状态转移模型,组合构建代理模型;根据代理模型的状态数据及强化学习算法,训练得到一个基础策略;将基础策略部署至各空调单元,分别使用与各空调单元相关的数据对部署至空调单元的基础策略微调,记录每一空调单元的微调策略。本说明书基于代理模型进行高样本效率的强化学习训练,得到单ACU控制的基础策略;引入平衡回放技术对基础策略进行微调,提高强化学习样本效率、控制精度及性能。

Patent Agency Ranking