发明公开
- 专利标题: 一种基于时空统计的IP地址画像方法
-
申请号: CN202111308488.0申请日: 2021-11-05
-
公开(公告)号: CN114037009A公开(公告)日: 2022-02-11
- 发明人: 杨晓林 , 张昊 , 承昊新 , 袁琪 , 王数 , 陆芸
- 申请人: 国网江苏省电力有限公司常州供电分公司 , 国网江苏省电力有限公司 , 国家电网有限公司
- 申请人地址: 江苏省常州市局前街27号; ;
- 专利权人: 国网江苏省电力有限公司常州供电分公司,国网江苏省电力有限公司,国家电网有限公司
- 当前专利权人: 国网江苏省电力有限公司常州供电分公司,国网江苏省电力有限公司,国家电网有限公司
- 当前专利权人地址: 江苏省常州市局前街27号; ;
- 代理机构: 常州佰业腾飞专利代理事务所
- 代理商 吴桑
- 主分类号: G06K9/62
- IPC分类号: G06K9/62 ; H04L69/22
摘要:
本发明公开了一种基于时空统计的IP地址画像方法,该方法包括:使用Count‑Min Sketch和最小堆这两种数据结构来保存网络中每个IP的访问与被访问情况;利用每个IP地址的Sketch生成一组时空矩阵,从而得到每个IP地址的特征信息;在此基础上对IP地址进行层次式聚类,并根据聚类结果为每个IP地址打上伪标签,形成群体IP地址画像,再根据同一标签下IP地址的频繁访问与被访问记录形成对该类IP地址的解析,完成个体IP地址画像。本发明方法使用基于Count‑Min Sketch与最小堆的概率数据结构,大大减少存储空间的同时,也能保证面对实时海量流数据时数据记录的准确性,并配合基于时空统计的IP地址画像算法,分别利用网络流全局信息和IP访问模式信息完成群体IP地址画像和个体IP地址画像。