-
公开(公告)号:CN116595435A
公开(公告)日:2023-08-15
申请号:CN202310463185.9
申请日:2023-04-26
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06F18/241 , H04L43/04 , G06F18/2321 , G06F16/903 , G06F16/28 , G06F16/2458
Abstract: 本发明提出一种面向大规模网络流量的特定信息提取方法,属于特定信息提取技术领域。包括以下步骤:S1.对网络流量进行预处理,得到明文流量json载荷的嵌入向量;S2.将嵌入向量作为输入对网络流量数据进行聚类;S3.提取同类明文流量数据json载荷的频繁项,形成频繁项集;S4.对同类明文流量数据json载荷的频繁项集中的键所对应明文的值进行核验,将目标特定信息的值所对应的键作为当前类别正则提取的规则;S5.根据规则对各类流量进行正则提取获得目标特定信息内容。解决现有技术中存在的人工构建模式过程耗时久以及提取精度差的技术问题。