基于深度强化学习的可迁移性网络流行为异常检测方法及装置
摘要:
本发明提供一种基于深度强化学习的可迁移性网络流行为异常检测方法及装置,所述方法包括模型训练阶段和流量识别阶段,模型训练阶段中,基于训练数据集中的数据点初始化环境;将训练数据集中的数据点作为本轮次的单轮训练集,将单轮训练集中的数据点逐个输入预设的智能体中进行训练;根据环境得到该数据点的状态组,将状态组输入到预设的智能体中,输出动作组,基于动作组输出数据点的数据类型;将输出的数据类型与数据点的标签类型进行比对,获取奖励值,对智能体中的参数进行更新;流量识别阶段中,接收待测流量数据,将待测流量数据中的数据点输入智能体得到数据点的数据类型。
0/0