基于深度强化学习的网络能耗与吞吐量联合优化路由方法

    公开(公告)号:CN114710439A

    公开(公告)日:2022-07-05

    申请号:CN202210437000.2

    申请日:2022-04-22

    摘要: 本发明公开了一种基于深度强化学习的网络能耗与吞吐量联合优化路由方法,首先将数据中心网络的路由调度描述为具有两个目标的混合整数非线性规划问题,即最大化网络吞吐量和最小化能量消耗;其次为深度强化学习算法生成大量的训练数据,主要包括当前网络状态、决策行为、奖励和新网络状态;最后选择卷积神经网络和全连接神经网络作为智能体,并使用训练数据对智能体进行训练操作,其核心理论是选择贝尔曼方程来评估每个行为的结果、定义贝尔曼误差为损失函数,通过梯度下降法来对其进行优化,直至收敛。本发明提供的方法适用于大规模、高动态性的数据中心网络,相较于其他方案(如帕累托最优)具备效率高和成本低的优点。