发明公开
- 专利标题: 一种针对多种网络日志进行语义解析及结构化的方法
-
申请号: CN202211444888.9申请日: 2022-11-18
-
公开(公告)号: CN115828888A公开(公告)日: 2023-03-21
- 发明人: 徐润 , 李瑶 , 樊一鸣 , 陈鑫 , 林小竺 , 周仲波 , 陈静怡 , 郑智浩 , 阙兴黔 , 邓德茂 , 张红月 , 胡兵轩
- 申请人: 贵州电网有限责任公司遵义供电局
- 申请人地址: 贵州省遵义市汇川区南京路555号
- 专利权人: 贵州电网有限责任公司遵义供电局
- 当前专利权人: 贵州电网有限责任公司遵义供电局
- 当前专利权人地址: 贵州省遵义市汇川区南京路555号
- 代理机构: 北京瑞盛铭杰知识产权代理事务所
- 代理商 李绩
- 主分类号: G06F40/205
- IPC分类号: G06F40/205 ; G06F40/30 ; G06F40/284 ; G06F16/25
摘要:
本发明提供有一种针对多种网络日志进行语义解析及结构化的方法,该方法包括以下步骤:数据预处理,将原始日志数据处理为算法要求的标准输入数据,包括命名实体识别、分词、过滤、大小写转换、向量化等;日志来源检测,针对不同来源的日志进行分析,总结其日志格式,并提取正则表达式,为每一个来源的日志构建日志格式,根据日志格式检测日志来源;本发明所述的针对多种网络日志进行语义解析及结构化的方法,该方法可以对文件/文件夹操作异常、网络异常、数据库异常、硬件异常、系统异常、其他异常等进行语义解析及结构化分析,快速针对不同来源组件的日志进行测试,每个组件日志各选择10000条日志进行测试,准确率达99.95%。