-
公开(公告)号:CN118568309A
公开(公告)日:2024-08-30
申请号:CN202411038164.3
申请日:2024-07-31
Applicant: 中南大学 , 中国铁道科学研究院集团有限公司 , 中国铁道科学研究院集团有限公司电子计算技术研究所 , 中国国家铁路集团有限公司
IPC: G06F16/901 , G06F40/186 , G06F16/904 , G06F18/10 , G06F18/22 , G06F18/23 , G06F18/25
Abstract: 本发明公开了一种基于日志审计的企业内部数据流通全流程追溯方法,包括:获取内部日志数据;对日志消息的时间戳、等级和组件信息进行提取并删除,完成预处理;基于树状框架构建不定长日志解析树,对日志数据进行解析,实现日志模板和日志参数的初步识别;设置组内相似度阈值,若初步识别的日志模板对应的组内相似度低于阈值,则将对应的日志组采用层次聚类重新解析;设置组间相似度阈值,若两个日志组之间的相似度高于阈值,则将两个日志组进行融合;提取关于数据流向的日志消息和日志消息对应的时间戳,根据数据传输流向形成有向溯源图。在保证正确率的基础上,实现了全自动非定长日志解析;通过生成有向溯源图确保了数据的流通过程清晰可见。
-
公开(公告)号:CN118568309B
公开(公告)日:2024-11-12
申请号:CN202411038164.3
申请日:2024-07-31
Applicant: 中南大学 , 中国铁道科学研究院集团有限公司 , 中国铁道科学研究院集团有限公司电子计算技术研究所 , 中国国家铁路集团有限公司
IPC: G06F16/901 , G06F40/186 , G06F16/904 , G06F18/10 , G06F18/22 , G06F18/23 , G06F18/25
Abstract: 本发明公开了一种基于日志审计的企业内部数据流通全流程追溯方法,包括:获取内部日志数据;对日志消息的时间戳、等级和组件信息进行提取并删除,完成预处理;基于树状框架构建不定长日志解析树,对日志数据进行解析,实现日志模板和日志参数的初步识别;设置组内相似度阈值,若初步识别的日志模板对应的组内相似度低于阈值,则将对应的日志组采用层次聚类重新解析;设置组间相似度阈值,若两个日志组之间的相似度高于阈值,则将两个日志组进行融合;提取关于数据流向的日志消息和日志消息对应的时间戳,根据数据传输流向形成有向溯源图。在保证正确率的基础上,实现了全自动非定长日志解析;通过生成有向溯源图确保了数据的流通过程清晰可见。
-