-
公开(公告)号:CN119402407A
公开(公告)日:2025-02-07
申请号:CN202411361257.X
申请日:2024-09-27
Applicant: 北京邮电大学
IPC: H04L45/02 , H04L47/125
Abstract: 本申请公开了一种基于强化学习的智能路由方法、装置及设备。包括:构建通信网络模型图,所述通信网络模型图包括多个网络节点,其中,每个网络节点为一个智能体;在任意时刻,每个网络节点获取当前与环境交互后得到的网络状态信息;将所述网络状态信息输入所述智能体的策略网络中,输出概率最大的动作;根据输出的动作信息确定数据包路由的下一网络节点,将数据包发送到选定的下一网络节点。本申请采用了一种自适应的多智能体强化学习算法,每个路由节点在无需建立路由表的情况下根据当前网络状态做出路由决策,与其他算法相比,实现了更低的数据包平均传输时延,提高了网络路由效率。