- 专利标题: 一种界标窗口下域名数据重复检测快速索引方法
-
申请号: CN201510117236.8申请日: 2015-03-17
-
公开(公告)号: CN104794158B公开(公告)日: 2018-11-13
- 发明人: 云晓春 , 徐小琳 , 李高超 , 郑礼雄 , 王树鹏 , 王勇 , 王振宇
- 申请人: 国家计算机网络与信息安全管理中心 , 中国科学院信息工程研究所
- 申请人地址: 北京市朝阳区裕民路甲3号
- 专利权人: 国家计算机网络与信息安全管理中心,中国科学院信息工程研究所
- 当前专利权人: 国家计算机网络与信息安全管理中心,中国科学院信息工程研究所
- 当前专利权人地址: 北京市朝阳区裕民路甲3号
- 代理机构: 北京君尚知识产权代理事务所
- 代理商 余长江
- 主分类号: G06F17/30
- IPC分类号: G06F17/30
摘要:
本发明涉及一种界标窗口下域名数据重复检测快速索引方法。该方法将界标窗口根据子界标分成多个子窗口,通过稳定性布隆过滤器和字典树维护各子窗口的数据项;针对网络数据流自适应地调整索引策略,在数据较为密集时采用稳定性布隆过滤器,在数据相对稀疏时采用字典树索引策略。在域名数据重复检测的适配方面,本发明提出将域名数据翻转,形成重叠前缀字符串比率较高的数据集,有利于后续字典树的快速匹配和存储容量缩减。本发明能够降低索引维护的空间,提升元素重复检测的效率,并能够扩展到分布式场景下,有效解决网络监控应用中域名数据重复检测的问题,同时,本发明可以扩展到分布式计算场景下,便于计算性能线性提升。
公开/授权文献
- CN104794158A 一种界标窗口下域名数据重复检测快速索引方法 公开/授权日:2015-07-22