一种多模式正则表达式匹配方法及装置

    公开(公告)号:CN104899264B

    公开(公告)日:2018-05-29

    申请号:CN201510262867.9

    申请日:2015-05-21

    发明人: 侯智瀚 邹荣珠

    IPC分类号: G06F17/30

    摘要: 本发明提供了一种多模式正则表达式匹配方法及装置,其中方法包括:按照预先建立的第一层过滤特征集对待匹配数据进行过滤得到第一层过滤的数据分片和命中的精确字符串;根据所述命中的精确字符串查找对应的正则表达式超集,按照所述正则表达式超集对所述第一层过滤的数据分片进行第二层过滤得到第二层过滤的数据分片和命中的正则表达式超集;根据所述命中的正则表达式超集确定对应的正则表达式,利用所述正则表达式对所述第二层过滤的数据分片作匹配。本发明的技术方案通过两层过滤方式提高过滤速率和过滤效果,进而以保证匹配性能的稳定性,在保证攻击性数据被过滤的情况下,尽可能避免纯净数据的通过。

    压缩文本检测方法和装置

    公开(公告)号:CN106789895B

    公开(公告)日:2020-03-27

    申请号:CN201611033285.4

    申请日:2016-11-18

    发明人: 侯智瀚

    IPC分类号: H04L29/06 H04L29/08

    摘要: 本申请提出一种压缩文本检测方法和装置,该压缩文本检测方法包括:获取待检测的压缩文本;对所述压缩文本进行模式匹配,获取输出序列;根据所述输出序列和已建立的特征命中概率计算模型,计算所述压缩文本的特征命中概率,并根据所述特征命中概率得到所述压缩文本对应的向量;根据所述向量和已建立的分类模型,确定所述压缩文本属于的类别。该方法能够避免对压缩文本放弃检测或延迟检测,从而兼顾网络传输安全和网络传输质量。

    数据匹配方法和装置、协议数据分析方法、装置和系统

    公开(公告)号:CN106790109B

    公开(公告)日:2020-01-24

    申请号:CN201611219685.4

    申请日:2016-12-26

    发明人: 侯智瀚 邹荣珠

    IPC分类号: H04L29/06

    摘要: 本公开涉及一种数据匹配方法和装置、协议数据分析方法、装置和系统,该数据匹配方法应用于词法分析器,包括:将待匹配的协议数据与所述词法分析器中的模式串集合进行匹配;在满足与所述词法分析器对应的匹配结束条件时终止匹配,并输出匹配结果;在匹配到匹配特征为安全检测标识的模式串的情况下,保存匹配到的匹配特征为安全检测标识的模式串对应的数据匹配范围,并且,所述匹配结果还包括所述安全检测标识。通过上述技术方案,词法分析器的匹配模式串集合中归集安全检测标识的模式串,可以在协议数据进行多模匹配时,保存并记录协议数据中的需要进行安全检测的协议数据,减少匹配次数,提升检测效率,同时安全检测不会影响协议解析的正确执行。

    压缩文本检测方法和装置

    公开(公告)号:CN106789895A

    公开(公告)日:2017-05-31

    申请号:CN201611033285.4

    申请日:2016-11-18

    发明人: 侯智瀚

    IPC分类号: H04L29/06 H04L29/08

    摘要: 本申请提出一种压缩文本检测方法和装置,该压缩文本检测方法包括:获取待检测的压缩文本;对所述压缩文本进行模式匹配,获取输出序列;根据所述输出序列和已建立的特征命中概率计算模型,计算所述压缩文本的特征命中概率,并根据所述特征命中概率得到所述压缩文本对应的向量;根据所述向量和已建立的分类模型,确定所述压缩文本属于的类别。该方法能够避免对压缩文本放弃检测或延迟检测,从而兼顾网络传输安全和网络传输质量。

    一种多模式正则表达式匹配方法及装置

    公开(公告)号:CN104899264A

    公开(公告)日:2015-09-09

    申请号:CN201510262867.9

    申请日:2015-05-21

    发明人: 侯智瀚 邹荣珠

    IPC分类号: G06F17/30

    CPC分类号: G06F17/30964

    摘要: 本发明提供了一种多模式正则表达式匹配方法及装置,其中方法包括:按照预先建立的第一层过滤特征集对待匹配数据进行过滤得到第一层过滤的数据分片和命中的精确字符串;根据所述命中的精确字符串查找对应的正则表达式超集,按照所述正则表达式超集对所述第一层过滤的数据分片进行第二层过滤得到第二层过滤的数据分片和命中的正则表达式超集;根据所述命中的正则表达式超集确定对应的正则表达式,利用所述正则表达式对所述第二层过滤的数据分片作匹配。本发明的技术方案通过两层过滤方式提高过滤速率和过滤效果,进而以保证匹配性能的稳定性,在保证攻击性数据被过滤的情况下,尽可能避免纯净数据的通过。

    网络攻击检测方法和装置

    公开(公告)号:CN107070852B

    公开(公告)日:2020-07-03

    申请号:CN201611118311.3

    申请日:2016-12-07

    发明人: 侯智瀚

    IPC分类号: H04L29/06

    摘要: 本发明提出一种网络攻击检测方法和装置,通过特征模块依据预先设定的关键字集合,对网络会话样本进行关键词匹配,以得到网络会话样本的特征之后,标注模块利用预先训练的隐马尔可夫模型,采用隐状态对网络会话样本的特征进行词性标注,从而起到解析的作用,处理模块将进行词性标注后的网络会话样本输入预先训练的分类模型,进行分类处理,以判定该网络会话样本是否存在网络攻击,由于无需人工进行协议解析,解决了现有技术中从样本数据中提取特征时,需要依赖于人工经验,且解析效率较低的技术问题。

    数据匹配方法和装置、协议数据分析方法、装置和系统

    公开(公告)号:CN106790109A

    公开(公告)日:2017-05-31

    申请号:CN201611219685.4

    申请日:2016-12-26

    发明人: 侯智瀚 邹荣珠

    IPC分类号: H04L29/06

    摘要: 本公开涉及一种数据匹配方法和装置、协议数据分析方法、装置和系统,该数据匹配方法应用于词法分析器,包括:将待匹配的协议数据与所述词法分析器中的模式串集合进行匹配;在满足与所述词法分析器对应的匹配结束条件时终止匹配,并输出匹配结果;在匹配到匹配特征为安全检测标识的模式串的情况下,保存匹配到的匹配特征为安全检测标识的模式串对应的数据匹配范围,并且,所述匹配结果还包括所述安全检测标识。通过上述技术方案,词法分析器的匹配模式串集合中归集安全检测标识的模式串,可以在协议数据进行多模匹配时,保存并记录协议数据中的需要进行安全检测的协议数据,减少匹配次数,提升检测效率,同时安全检测不会影响协议解析的正确执行。

    一种垃圾邮件的检测方法及装置

    公开(公告)号:CN104967558A

    公开(公告)日:2015-10-07

    申请号:CN201510316823.X

    申请日:2015-06-10

    发明人: 侯智瀚 邹荣珠

    IPC分类号: H04L12/58 H04L29/06

    摘要: 本申请提供了一种垃圾邮件的检测方法及装置,其中方法包括:根据样本库和特征词词库生成样本向量,所述特征词词库包括从所述样本库的样本邮件提取的正常邮件类特征词和垃圾邮件类特征词;选择支持向量机的线性核函数,以所述样本向量作为输入训练得到分类函数;根据所述分类函数的系数确定所述特征词词库中特征词的权值,筛选出权值非零值的特征词以生成特征词集合,并根据所述分类函数的偏移量确定判定阈值;根据所述特征词集合统计待检测邮件包含的特征词的权值总和,当该权值总和超过所述判定阈值时,确定该邮件为垃圾邮件。本申请节省了检测过程的计算量,在保证检测精度的情况下,提高了检测效率。

    基于GPU异构计算平台的字符串匹配方法及系统

    公开(公告)号:CN103559017A

    公开(公告)日:2014-02-05

    申请号:CN201310508005.0

    申请日:2013-10-23

    发明人: 侯智瀚 杨枭

    IPC分类号: G06F9/38

    摘要: 本发明提供了一种基于GPU异构计算平台的字符串匹配方法及系统,其中的方法包括预处理阶段和匹配阶段;其中,在预处理阶段包括对特征字符串进行预处理,以及分别在CPU主存和GPU全局存储器上分配待匹配数据缓存和结果缓存;在匹配阶段对待匹配数据与特征字符串进行匹配,包括在对待匹配数据进行预处理后,在GPU中对待匹配数据与特征字符串的前缀进行匹配,将匹配成功的待匹配数据按命中位置复制到结果缓存中,然后将结果缓存中的数据复制到CPU主存的结果缓存中;在CPU中,通过散列方式找到与命中位置相对应的特征字符串,将待匹配数据与特征字符串逐字进行匹配确认。通过本发明能够缩短线程流程及减少线程流程分支,提升字符串的匹配效率。

    海量特征串集合的匹配方法及系统

    公开(公告)号:CN103544208A

    公开(公告)日:2014-01-29

    申请号:CN201310363274.2

    申请日:2013-08-16

    发明人: 侯智瀚 尹延伟

    IPC分类号: G06F17/30

    CPC分类号: G06F19/24

    摘要: 本发明提供了一种海量特征串集合的匹配方法及系统,其中的方法包括预处理阶段和特征串匹配阶段,其中,在预处理阶段通过对特征串进行统计并分组,建立位向量掩码表,使过滤算法在同等空间和规则数量下的通过率更低,进而能够容纳更多的特征串;在特征串匹配阶段,采用位并行方式进行后缀和前缀匹配,支持不等长特征串的匹配并且在匹配数据中能够以跳跃的方式大范围快速查找特征串;通过区分普通匹配窗口和长匹配窗口,来保证跳跃的安全和减少过滤通过率。通过本发明能够使匹配过程在相同资源条件下,能够容纳数量更多的特征串,并且具有性能稳定的特点,能够在极端情况下保持模式匹配的高效率。