-
公开(公告)号:CN114416479A
公开(公告)日:2022-04-29
申请号:CN202210031701.6
申请日:2022-01-12
Applicant: 大连海事大学
IPC: G06F11/30 , G06F40/205 , G06F40/30 , G06F16/17 , G06F16/182 , G06N3/04 , G06N3/08
Abstract: 本发明提供一种基于流外正则化的日志序列异常检测方法,该方法对BERT模型进行优化并将其作为语义特征提取模型,优化方法是将MixUp数据增强作为流外正则化的一种形式,在数据流形之外的模型输入空间上施加线性约束,将生成器和鉴别器分别嵌入到BERT模型的不同Encoder层。通过训练鉴别器来检测输入嵌入是否位于流形外,优化生成器来生成流形外嵌入,使其易于被鉴别器识别为流形外嵌入,以便发现对日志序列分类任务有用但通过单词访问不到的嵌入,提高异常检测的准确性。此外,本发明分别从日志条目与日志序列两个粒度上提取日志语义特征,不仅可以提取日志序列的语义特征,还可以提取到日志条目本身包含的语义信息,从而增强异常检测的鲁棒性。
-
公开(公告)号:CN114416479B
公开(公告)日:2025-04-25
申请号:CN202210031701.6
申请日:2022-01-12
Applicant: 大连海事大学
IPC: G06F11/30 , G06F40/205 , G06F40/30 , G06F16/17 , G06F16/182 , G06N3/045 , G06N3/088
Abstract: 本发明提供一种基于流外正则化的日志序列异常检测方法,该方法对BERT模型进行优化并将其作为语义特征提取模型,优化方法是将MixUp数据增强作为流外正则化的一种形式,在数据流形之外的模型输入空间上施加线性约束,将生成器和鉴别器分别嵌入到BERT模型的不同Encoder层。通过训练鉴别器来检测输入嵌入是否位于流形外,优化生成器来生成流形外嵌入,使其易于被鉴别器识别为流形外嵌入,以便发现对日志序列分类任务有用但通过单词访问不到的嵌入,提高异常检测的准确性。此外,本发明分别从日志条目与日志序列两个粒度上提取日志语义特征,不仅可以提取日志序列的语义特征,还可以提取到日志条目本身包含的语义信息,从而增强异常检测的鲁棒性。
-
公开(公告)号:CN114138973B
公开(公告)日:2024-07-16
申请号:CN202111468162.4
申请日:2021-12-03
Applicant: 大连海事大学
IPC: G06F16/35 , G06F40/30 , G06F18/22 , G06F18/2433 , G06N3/0455 , G06N3/0475 , G06N3/0895 , G06N3/09 , G06N3/094
Abstract: 本发明提供一种基于对比对抗训练的日志序列异常检测方法,包括训练和检测两个阶段。训练阶段包括对日志数据进行解析;获取日志序列并提取出一个负样本日志序列集合;判断检测模型的损失是否趋于稳定,如果趋于稳定,则使用FGM进行对抗训练扰动BERT的嵌入层;将正、负样本日志序列输入到模型中,生成被扰动的语义向量后取消对嵌入层的扰动,再次生成未被扰动的语义向量;使用对比学习并且继续保持原本的有监督训练任务来对模型进行训练;判断训练集中是否已经没有日志序列,如果判断没有需要训练的日志序列则停止训练。检测阶段包括将待检测的日志序列输入到训练后的日志序列异常检测模型,查看模型的输出,根据输出结果判断日志序列是否异常。
-
公开(公告)号:CN113778733A
公开(公告)日:2021-12-10
申请号:CN202111014950.6
申请日:2021-08-31
Applicant: 大连海事大学
Abstract: 本发明提供一种基于多尺度MASS的日志序列异常检测方法,涉及日志序列异常检测技术领域,包括训练阶段和检测阶段,本发明方法通过学习正常日志序列的模式,对偏离正常日志序列的异常模式进行检测。首先,从非结构化的日志中提取结构化的日志键;其次,为了捕获日志序列中不同尺度的上下文依赖,提高获取日志上下文信息的能力,本发明对MASS模型的Attention机制进行改进,将其替换为多尺度Attention;最后,将正常日志序列输入到改进的MASS模型中学习正常模式,利用其Mask机制对日志序列进行异常检测。在两个日志数据集上的实验结果表明,本发明方法优于现有的大多数基于日志序列的异常检测方法。
-
公开(公告)号:CN113778733B
公开(公告)日:2024-03-15
申请号:CN202111014950.6
申请日:2021-08-31
Applicant: 大连海事大学
IPC: G06F11/07 , G06N3/0455 , G06N3/08
Abstract: 本发明提供一种基于多尺度MASS的日志序列异常检测方法,涉及日志序列异常检测技术领域,包括训练阶段和检测阶段,本发明方法通过学习正常日志序列的模式,对偏离正常日志序列的异常模式进行检测。首先,从非结构化的日志中提取结构化的日志键;其次,为了捕获日志序列中不同尺度的上下文依赖,提高获取日志上下文信息的能力,本发明对MASS模型的Attention机制进行改进,将其替换为多尺度Attention;最后,将正常日志序列输入到改进的MASS模型中学习正常模式,利用其Mask机制对日志序列进行异常检测。在两个日志数据集上的实验结果表明,本发明方法优于现有的大多数基于日志序列的异常检测方法。
-
公开(公告)号:CN114138973A
公开(公告)日:2022-03-04
申请号:CN202111468162.4
申请日:2021-12-03
Applicant: 大连海事大学
Abstract: 本发明提供一种基于对比对抗训练的日志序列异常检测方法,包括训练和检测两个阶段。训练阶段包括对日志数据进行解析;获取日志序列并提取出一个负样本日志序列集合;判断检测模型的损失是否趋于稳定,如果趋于稳定,则使用FGM进行对抗训练扰动BERT的嵌入层;将正、负样本日志序列输入到模型中,生成被扰动的语义向量后取消对嵌入层的扰动,再次生成未被扰动的语义向量;使用对比学习并且继续保持原本的有监督训练任务来对模型进行训练;判断训练集中是否已经没有日志序列,如果判断没有需要训练的日志序列则停止训练。检测阶段包括将待检测的日志序列输入到训练后的日志序列异常检测模型,查看模型的输出,根据输出结果判断日志序列是否异常。
-
-
-
-
-