一种基于时空统计的IP地址画像方法
摘要:
本发明公开了一种基于时空统计的IP地址画像方法,该方法包括:使用Count‑Min Sketch和最小堆这两种数据结构来保存网络中每个IP的访问与被访问情况;利用每个IP地址的Sketch生成一组时空矩阵,从而得到每个IP地址的特征信息;在此基础上对IP地址进行层次式聚类,并根据聚类结果为每个IP地址打上伪标签,形成群体IP地址画像,再根据同一标签下IP地址的频繁访问与被访问记录形成对该类IP地址的解析,完成个体IP地址画像。本发明方法使用基于Count‑Min Sketch与最小堆的概率数据结构,大大减少存储空间的同时,也能保证面对实时海量流数据时数据记录的准确性,并配合基于时空统计的IP地址画像算法,分别利用网络流全局信息和IP访问模式信息完成群体IP地址画像和个体IP地址画像。
0/0