一种针对加密代理和隧道技术的网站指纹识别方法
摘要:
本发明涉及一种针对加密代理和隧道技术的网站指纹识别方法,包括:进行流量预处理,从数据包大小和数据包方向提取特征,进行包长过滤;进行流量表征,通过序列模板对挖掘、子流序列生成,对数据包进行关联,构建一系列有因果关联的子流序列即因果关系链;构建指纹识别模型,输入一系列子流序列,输出子流序列对应的目标网站类别标签。本发明利用流量连接建立过程中不同数据包长之间的关联关系,通过过滤简化数据包包长序列,减少了噪声,能够更准确地识别目标网站;基于因果关联发现不同数据包长之间的关联关系,将属于不同网站的纠缠数据包解耦为一系列因果关系链,显著减轻了由多个并发网站访问可能引起的信息混乱。
0/0