-
公开(公告)号:CN118607503A
公开(公告)日:2024-09-06
申请号:CN202410836512.5
申请日:2024-06-26
申请人: 天翼云科技有限公司
发明人: 张钰鸿
IPC分类号: G06F40/186 , G06F16/35 , G06F40/237 , G06F18/22 , G06F40/216
摘要: 本发明涉及一种相似日志模板提取方法及装置,属于相似日志模板提取领域,该方法包括:获取待提取相似日志模板的日志;计算得到日志公共字符串的熵,根据熵和日志的可观测特征对日志进行分类与剔除后进行排序;将排序后的日志输入滑动窗口循环调整匹配阈值;计算字符串间的公共前缀长度更新词汇库,对排序后的日志与词汇库进行距离判断,提取排序后的日志中符合匹配阈值的内容;将提取内容与排序后的日志的日志做序列量化分析判断提取内容是否满足相似度设定,若判断结果为提取内容满足相似度设定,记录日志索引信息,聚合日志模板。本发明优化了相似日志模板相似度判断流程,重点判断信息密集区域,提高了相似日志模板提取的效率与准确性。