-
公开(公告)号:CN120075071A
公开(公告)日:2025-05-30
申请号:CN202510191064.2
申请日:2025-02-20
Applicant: 北京科技大学
IPC: H04L41/14 , H04L41/16 , H04L67/12 , H04B17/309 , H04B17/364 , G06N3/092
Abstract: 本发明提供一种基于双时间尺度强化学习网络模态配置与调整方法及装置,涉及通信技术领域。该方法包括:构建无人机辅助网络模态的系统模型;根据系统模型构建优化问题模型;将优化问题模型在强化学习的框架下重构为双时间尺度马尔科夫决策过程;通过基于双时间尺度强化学习的方案进行求解。本发明将优化问题解耦为网络模态级和用户级两个不同时间尺度上的优化子问题,并基于强化学习中的评论家网络被用于在某个特定状态下期望的累计折扣奖励的特性,利用评论家网络预测网络模态参数的重新配置与调整的收益,然后通过将其与网络模态参数的重新配置与调整的成本相比较,实现了网络模态参数的自适应动态配置与调整。
-
公开(公告)号:CN118113482A
公开(公告)日:2024-05-31
申请号:CN202410515391.4
申请日:2024-04-26
Applicant: 北京科技大学
Abstract: 本发明提供一种针对智能窃听者的安全计算卸载方法和系统,包括:构建存在智能窃听者的多无人机辅助的移动边缘计算网络的系统模型和计算任务的两阶段卸载模型;计算系统的总延迟和能耗,设计最大最小的优化问题并分解为两个子问题,对于合法无人机和窃听无人机,优化目标分别是最大化和最小化计算任务的执行效率;以MAPPO算法为基础算法,结合零和博弈思想,将两个子问题转化为两个部分可观测的马尔可夫博弈,进行对抗多智能体强化学习,合法无人机和窃听无人机交替作为MAPPO的智能体与环境交互,分别以最大化和最小化计算任务的执行效率为目标优化各自的策略,直至收敛,得到最优的安全计算卸载方案。本发明在对抗智能窃听无人机时有显著的优势。
-
公开(公告)号:CN120075126A
公开(公告)日:2025-05-30
申请号:CN202510485293.5
申请日:2025-04-17
Applicant: 北京科技大学
Abstract: 本发明提供了一种QoS路由优化方法、系统、计算机及可读存储介质,包括:S1:获取实时网络性能数据集,所述实时网络性能数据集包括链路带宽、延迟和丢包率;S2:基于所述实时网络性能数据集建模网络拓扑为图结构,生成网络状态特征矩阵;S3:根据所述网络状态特征矩阵构建状态空间和动作空间,所述动作空间包括从源节点到目标节点的多条候选路径;S4:通过主网络从所述动作空间选择候选路径,采用目标网络评估所述候选路径的性能价值,根据所述性能价值更新所述主网络,生成经验数据集;S5:根据所述经验数据集优化路径选择策略,更新路由表。本发明可在动态网络环境中不同业务的环境下,为数据流找到满足QoS需求的最佳路径。
-
公开(公告)号:CN118113482B
公开(公告)日:2024-08-13
申请号:CN202410515391.4
申请日:2024-04-26
Applicant: 北京科技大学
Abstract: 本发明提供一种针对智能窃听者的安全计算卸载方法和系统,包括:构建存在智能窃听者的多无人机辅助的移动边缘计算网络的系统模型和计算任务的两阶段卸载模型;计算系统的总延迟和能耗,设计最大最小的优化问题并分解为两个子问题,对于合法无人机和窃听无人机,优化目标分别是最大化和最小化计算任务的执行效率;以MAPPO算法为基础算法,结合零和博弈思想,将两个子问题转化为两个部分可观测的马尔可夫博弈,进行对抗多智能体强化学习,合法无人机和窃听无人机交替作为MAPPO的智能体与环境交互,分别以最大化和最小化计算任务的执行效率为目标优化各自的策略,直至收敛,得到最优的安全计算卸载方案。本发明在对抗智能窃听无人机时有显著的优势。
-
-
-