一种基于指纹库的网络图片流量锚定和识别方法

    公开(公告)号:CN118573395A

    公开(公告)日:2024-08-30

    申请号:CN202410464624.2

    申请日:2024-04-17

    申请人: 东南大学

    摘要: 本发明公开了一种基于指纹库的网络图片流量锚定和识别方法,该方案通过利用网页图片来源、大小等信息构建图片指纹,从网络流量中识别出访问图片的流量和访问信息。本发明中的识别方案分为指纹库构建和识别两个阶段。首先对目标网页进行图片信息采集,将采集到的图片信息作为图片指纹构建图片指纹库。然后在识别阶段,将网页访问流量按五元组组流,利用数据包中包含的SNI(ServerNameIndication)信息将组流后的流量分组;然后将分组后的数据还原,提取数据长度等信息,得到流量指纹,与指纹库中的指纹比较,从而实现对图片流量的识别。该方法可以应用于网络空间管理,根据已有的公害图片信息,对公害图片流量进行精准定位和识别。

    一种面向自适应流媒体的视频传输指纹快速生成方法

    公开(公告)号:CN114925249B

    公开(公告)日:2024-07-12

    申请号:CN202210552435.1

    申请日:2022-05-20

    申请人: 东南大学

    摘要: 本发明公开了一种面向自适应流媒体的视频传输指纹快速生成方法,自适应流媒体协议在传输视频时分片顺序传输,分片的顺序及分片长度构成了视频的传输指纹。该方法基于自适应流媒体协议HLS和DASH的视频传输标准,根据常见的视频平台的特点,解析给定的URL,从页面信息中提取与该视频相关的信息,根据提取到的有效信息进一步调用视频播放接口或者请求视频描述文件,从而提取相应的分片长度等信息,得到视频传输指纹。该方法无需下载完整的视频文件,仅需下载少量信息就可以获得准确的视频传输指纹,减少了视频传输指纹获取所需的存储资源,并且过程中无需人为操作,极大地提升了视频传输指纹的获取速度。

    一种面向自适应流媒体的视频传输指纹快速生成方法

    公开(公告)号:CN114925249A

    公开(公告)日:2022-08-19

    申请号:CN202210552435.1

    申请日:2022-05-20

    申请人: 东南大学

    摘要: 本发明公开了一种面向自适应流媒体的视频传输指纹快速生成方法,自适应流媒体协议在传输视频时分片顺序传输,分片的顺序及分片长度构成了视频的传输指纹。该方法基于自适应流媒体协议HLS和DASH的视频传输标准,根据常见的视频平台的特点,解析给定的URL,从页面信息中提取与该视频相关的信息,根据提取到的有效信息进一步调用视频播放接口或者请求视频描述文件,从而提取相应的分片长度等信息,得到视频传输指纹。该方法无需下载完整的视频文件,仅需下载少量信息就可以获得准确的视频传输指纹,减少了视频传输指纹获取所需的存储资源,并且过程中无需人为操作,极大地提升了视频传输指纹的获取速度。

    一种面向HTTP/2流量多路复用特征的加密视频识别方法

    公开(公告)号:CN116744052A

    公开(公告)日:2023-09-12

    申请号:CN202310428925.5

    申请日:2023-04-20

    申请人: 东南大学

    摘要: 本发明公开了一种面向HTTP/2流量多路复用特征的加密视频识别方法,针对使用多路复用HTTP/2协议的加密视频,该方法首先利用自动化数据采集模块,采集视频明文数据获取视频明文指纹,并在网络中间节点采集视频加密传输数据,从而构建大型视频明文指纹库和加密视频传输数据集,其次利用修正指纹构建模块,通过对加密视频传输数据进行精准还原,构建加密视频修正指纹,最后利用加密视频识别模块,以加密视频修正指纹和大型视频明文指纹库为基础,通过加密视频修正指纹滑动匹配方法,识别HTTP/2加密视频。本发明通过视频明文指纹识别由DASH技术分发的HTTP/2加密视频,具有通用性,此外,本发明可应用于不断变化的真实网络环境,具有较好的泛化性能。

    一种面向复杂网络环境的细粒度网页识别方法

    公开(公告)号:CN115982915A

    公开(公告)日:2023-04-18

    申请号:CN202310137087.6

    申请日:2023-02-20

    申请人: 东南大学

    发明人: 吴桦 刘嵩涛 程光

    摘要: 本发明涉及一种面向复杂网络环境的细粒度网页识别方法,首先将网页访问流量按五元组切流,并利用数据包中包含的SNI信息将切流后的流量分组;然后将特定分组中的数据包重组为TLS分片,并提取长度信息。在对同一网页的多次访问过程中,能代表网页特征的ADU会被重复请求,通过统计TLS分片长度信息中的频繁项,构造表征网页的特征向量,这些特征向量被视作网页指纹。本发明利用聚类修正特征向量的数值波动,并设计词袋模型修正特征向量的顺序波动,最终,将修正后的特征向量输入机器学习模型进行训练,得到能精准识别网页的分类器。该方法能够在复杂网络环境下得到稳定的细粒度网页指纹,用于对公害网页访问行为的精准识别。