-
公开(公告)号:CN119520154A
公开(公告)日:2025-02-25
申请号:CN202411789779.X
申请日:2024-12-06
Applicant: 国网山东省电力公司聊城供电公司
Inventor: 王显盖 , 张建峰 , 周海全 , 史吏 , 郭锐 , 江成强 , 余阿均 , 王继生 , 孙动一 , 张婷婷 , 张艳艳 , 刘方方 , 徐英会 , 侯晓宁 , 武乃虎 , 王国卿 , 赵伟聪 , 吴中辉 , 孙俭军 , 闫敏 , 李伟蒙
Abstract: 本发明涉及一种针对网络威胁的强化学习决策方法、装置及存储介质,涉及网络安全的强化学习决策领域。本申请中基于网络关系图和可学习的上下文表征创建网络状态;通过信息传递神经网络对网络状态进行局部和全局的信息传递得到强化学习中决策智能体的输入编码,决策智能体包括:在不同网络拓扑结构中引入威胁场景下,强化学习训练的第一决策网络和第二决策网络,所述第一决策网络根据全局编码选择应对威胁的目标主机:所述第二决策网络根据目标节点的隐藏状态和节点向量特征预测目标主机应对威胁所采取的目标动作:控制目标主机执行目标动作,进行威胁处理。本申请支持动态网络的网络状态到动作的决策分布建模。