一种基于语义距离和TCN-Attention的日志序列异常检测方法

    公开(公告)号:CN117313741A

    公开(公告)日:2023-12-29

    申请号:CN202311191162.3

    申请日:2023-09-14

    Abstract: 本发明公开了一种基于语义距离和TCN‑Attention的日志序列异常检测方法,包括以下步骤:利用Drain算法进行日志解析,将非结构化的日志条目转化为结构化的日志集合;采用LDA提取日志主题词并采用Word2vec建模词向量,通过计算语义距离为所有日志词赋予不同大小的权重因子,基于加权聚合的方式生成日志语义特征;利用TCN来分析日志序列中相邻和间隔日志事件间的关系,在局部和全局角度捕获日志上下文信息;利用attention自动地学习不同日志事件的重要性,捕获日志序列的关键特征;将日志序列关键特征输入到MLP进行日志序列异常检测。本发明能够突出日志序列的关键特征,从而准确地检测出更多异常日志序列。

    一种基于深度聚类的无监督日志序列异常检测方法

    公开(公告)号:CN118227365A

    公开(公告)日:2024-06-21

    申请号:CN202410402288.9

    申请日:2024-04-03

    Abstract: 本发明公开了一种基于深度聚类的无监督日志序列异常检测方法,包括:基于Drain对原始日志数据进行解析生成日志模板;使用BERT模型对日志模板进行编码得到日志语义特征;基于LSTM的AE模型对所述日志语义特征进行重构预训练;利用自由度为1的t‑分布作为软聚类算法,通过预训练编码器与软聚类算法构建深度聚类模型;通过余弦相似度对模糊类的日志语义特征进行再次分类,将相似度高的归为正常类,将相似度低的归为异常类。本发明通过有效利用日志序列语义特征提取和后续聚类之间的信息反馈来实现对二者的联合优化,使二者的性能互相提升,进一步实现有效的日志异常检测。

Patent Agency Ranking