一种基于知识及深度强化学习的电力通信网路由优化方法
摘要:
本发明涉及电力通信技术领域,尤其是一种基于知识及深度强化学习的电力通信网路由优化方法,方法包括:构建深度强化学习模型;图神经网络将拓扑结构和链路特征通过消息传递神经网络传递至全连接神经网络;计算当前节点至各个路由的最短链路;计算选择各个路由进行电力通信时的负载均衡因子作为奖励值;通过动态更新链路权值,选择奖励值最大的路由作为最优选择;构建损失函数;以损失函数最小为目标,对模型进行训练,并得到价值函数;通过价值函数对深度强化学习模型的模型参数进行更新;获取实时拓扑结构、实时链路特征、实时流量需求信息;通过训练完成的深度强化学习模型,输出最优选择,并根据最优选择进行路由配置。
0/0