-
公开(公告)号:CN120090879A
公开(公告)日:2025-06-03
申请号:CN202510571201.5
申请日:2025-05-06
Applicant: 广州大学
Abstract: 本发明提供了一种蜜点地址突变决策方法、系统及可读存储介质,该方法包括:构建攻防场景网络拓扑图;构建博弈模型,并定义博弈模型中攻防双方的动作集,以根据动作集获取攻防双方的收益函数和成本函数,并根据收益函数和成本函数构建瞬时效用函数;根据瞬时效用函数构建并初始化双人Q‑learning模型,得到状态动作矩阵;对双人Q‑learning模型进行迭代训练,以更新状态动作矩阵,并设定双人Q‑learning模型的收敛指标,以根据更新后的状态动作矩阵获取防御者的最优策略,并根据最优策略将选定的蜜点地址突变到攻防场景网络拓扑图中的主机地址中。本申请能够使得防御者可以在理性攻击者的情况下找到防御者最佳的蜜点地址变换策略,从而将蜜点地址变换到最佳位置。
-
公开(公告)号:CN120090880A
公开(公告)日:2025-06-03
申请号:CN202510571314.5
申请日:2025-05-06
Applicant: 广州大学
Abstract: 本发明提供了一种基于自博弈强化学习的蜜阵防御资源分配优化方法,涉及网络安全防御技术领域。所述优化方法包括以下步骤:基于网络拓扑部署防御资源,建立主机与防御资源之间的映射关系;基于所述映射关系进行攻防对抗模拟获得初始攻击策略和初始防御策略;基于初始攻击策略和初始防御策略构建马尔科夫博弈模型;基于深度确定性策略梯度算法对所述马尔科夫博弈模型的攻防训练进行自博弈强化学习;基于Actor‑Critic算法对所述攻防训练进行价值评估获得最优防御资源分配策略。实施本发明提供的优化方法能够使防御方与攻击方进行自博弈强化学习,在对抗中动态调整防御策略,提升了防御效果。
-