一种基于dijkstra辅助的两跳学习深度强化学习路由策略方法

发明公开

CN118175083A 一种基于dijkstra辅助的两跳学习深度强化学习路由策略方法审中-实审转让

请登陆查看更多内容

专利标题： 一种基于dijkstra辅助的两跳学习深度强化学习路由策略方法
申请号： CN202410201919.0

申请日： 2024-02-23
公开(公告)号： CN118175083A

公开(公告)日： 2024-06-11
发明人: 田丰 , 刘会杰 , 丁兆龙 , 赵思琳 , 张硕 , 董明佶 , 陆珊 , 杨子健 , 王文倩 , 任超宇
申请人： 中国科学院微小卫星创新研究院 , 上海微小卫星工程中心
申请人地址： 上海市浦东新区雪洋路1号;
专利权人： 中国科学院微小卫星创新研究院,上海微小卫星工程中心
当前专利权人： 中国科学院微小卫星创新研究院,上海微小卫星工程中心　上海卫星互联网研究院有限公司
当前专利权人地址： 200137 上海市浦东新区雪洋路1号
代理机构： 上海申浩律师事务所
代理商 赵青
主分类号： H04L45/02
IPC分类号： H04L45/02 ; H04B7/185

摘要：

本发明公开了一种基于dijkstra辅助的两跳学习深度强化学习路由策略方法，解决了传统路由算法无法根据当前的网络状态进行在线决策的问题，该多智能体强化学习路由算法将每颗卫星视作一个智能体，它通过与环境的不断交互学习最优的路由策略，当卫星网络环境发生改变时，卫星会及时调整路由策略。主要有以下三个优点：1、该方案为在线决策路由算法，可以根据网络环境自主的更新路由策略。2、该方案为分布式路由算法，不会加重卫星负载，节省了星上资源。3、该路由算法的收敛速度快，节省了训练资源。4、本算法采用两跳学习法，扩大智能体的感知域，更快的感知到卫星网络环境的变化，转发策略更优。

信息查询

中国专利公布公告 Global Dossier Espacenet

IPC分类:

H	电学
H04	电通信技术
H04L	数字信息的传输，例如电报通信（电报和电话通信的公用设备入H04M）
H04L45/00	数据交换网络中数据包的路由或寻路（无线网络中的路由或寻路入H04W40/00）
H04L45/02	.拓扑结构的更新或发现