-
公开(公告)号:CN106959962A
公开(公告)日:2017-07-18
申请号:CN201610017565.X
申请日:2016-01-12
申请人: 中国移动通信集团青海有限公司
IPC分类号: G06F17/30
摘要: 本发明公开了一种多模式字符串匹配方法和装置,用以提高多模式字符串匹配的匹配效率和匹配速度。所述方法中,将模式串中具有前缀包含关系的模式串压缩到一个模式串中得到压缩模式集;根据压缩模式集构造前缀集;并根据预设算法为前缀集构造AC自动机;包括:针对待匹配的文本串,将当前滑动窗口所包含的字符依次输入AC自动机中得到至少一个初次匹配位置;针对每一初次匹配位置,如果其匹配的字符串长度小于预设长度,则将其和匹配的字符串添加至匹配结果集中;如果其匹配的字符串长度等于预设长度,则将该其加入到二次匹配入口集合中;针对每一入口位置分别进行二次匹配,并将进行二次匹配的入口位置和匹配的字符串添加至匹配结果集中。
-
公开(公告)号:CN106959962B
公开(公告)日:2019-10-15
申请号:CN201610017565.X
申请日:2016-01-12
申请人: 中国移动通信集团青海有限公司
IPC分类号: G06F16/903
摘要: 本发明公开了一种多模式字符串匹配方法和装置,用以提高多模式字符串匹配的匹配效率和匹配速度。所述方法中,将模式串中具有前缀包含关系的模式串压缩到一个模式串中得到压缩模式集;根据压缩模式集构造前缀集;并根据预设算法为前缀集构造AC自动机;包括:针对待匹配的文本串,将当前滑动窗口所包含的字符依次输入AC自动机中得到至少一个初次匹配位置;针对每一初次匹配位置,如果其匹配的字符串长度小于预设长度,则将其和匹配的字符串添加至匹配结果集中;如果其匹配的字符串长度等于预设长度,则将该其加入到二次匹配入口集合中;针对每一入口位置分别进行二次匹配,并将进行二次匹配的入口位置和匹配的字符串添加至匹配结果集中。
-