一种针对多种网络日志进行语义解析及结构化的方法
摘要:
本发明提供有一种针对多种网络日志进行语义解析及结构化的方法,该方法包括以下步骤:数据预处理,将原始日志数据处理为算法要求的标准输入数据,包括命名实体识别、分词、过滤、大小写转换、向量化等;日志来源检测,针对不同来源的日志进行分析,总结其日志格式,并提取正则表达式,为每一个来源的日志构建日志格式,根据日志格式检测日志来源;本发明所述的针对多种网络日志进行语义解析及结构化的方法,该方法可以对文件/文件夹操作异常、网络异常、数据库异常、硬件异常、系统异常、其他异常等进行语义解析及结构化分析,快速针对不同来源组件的日志进行测试,每个组件日志各选择10000条日志进行测试,准确率达99.95%。
0/0