一种基于关键字词频特征的多模式匹配方法

    公开(公告)号:CN105373601B

    公开(公告)日:2019-05-21

    申请号:CN201510755911.X

    申请日:2015-11-09

    Abstract: 本发明提供一种基于关键字词频特征的多模式匹配方法,首先从已知的信息数据库中提取关键字并统计出现频率作为其词频信息,其次采用构造含有关键字词频信息的二叉树完成其中的模式串匹配,在字符匹配过程中若出现字符不相等,则与该不匹配字符所在节点的兄弟节点所含字符进行匹配。其利用信息来源的模式的关键字词频信息构造基于字典树的二叉树完成其中的模式串的匹配,并与AC算法进行了比较。传统的AC算法需要维护三张表,并且在模式匹配过程中会频繁访问这三张表;本发明的一种基于关键字词频特征的多模式匹配方法更多的利用了模式本身的词频信息,并不需要维护过多的信息,这就大大减少了系统的内存消耗。

    基于新闻数据及相关评论信息的一种特定群体发现方法

    公开(公告)号:CN107679069A

    公开(公告)日:2018-02-09

    申请号:CN201710710365.7

    申请日:2017-08-18

    CPC classification number: G06F17/30705 G06F17/30687 G06F17/30867

    Abstract: 本发明提供基于新闻数据及相关评论信息的一种特定群体发现方法。包括以下步骤:采集所针对的媒体中的新闻数据信息及相关评论信息;对新闻数据信息根据其文本内容进行分类,得到不同的类簇;根据相关评论信息,以包含新闻数据信息的评论数最高的类簇作为样本,获取该类簇中新闻数据消息的所有评论及发表评论的用户;通过对所有评论的内容进行分词得到关键词,以出现次数高于一阀值的关键词作为高频词;采用向量空间模型表示评论的内容,通过凝聚式层次对评论的文本聚类,根据聚类结果,得到不同类簇的评论用户参考特征;根据高频词及评论用户参考特征,识别特定群体。能够通过分析评论信息内容快速地智能地发现机器人账号,从而及时进行处理。

    一种动态部署安全能力的实现方法

    公开(公告)号:CN107346259A

    公开(公告)日:2017-11-14

    申请号:CN201710326354.9

    申请日:2017-05-10

    Abstract: 本发明公开了一种动态部署安全能力的实现方法。本方法为:1)云网络的云安全中心创建一安全虚机,并加载安全能力的镜像到该安全虚机;安全虚机为运行安全业务的虚拟机;2)云安全中心将路由策略发送给云租户网络的虚拟路由器,将相应的业务流量牵引到该安全虚机上;3)当云网络中存在多个安全虚机时,云安全中心选取一安全虚机作为主安全虚机;并将需安全防护的流量牵引到该主安全虚机;4)该主安全虚机将流量分配给其他安全虚机并建立一分流规则表;5)云安全中心监控各安全虚机的设定关键性能指标,确定是否存在需要释放的安全虚机;当待释放的安全虚机流连接数为0时释放该安全虚机。本发明根据用户的实际业务流量大小来进行弹性伸缩。

    一种互联网网站相似度分析方法、装置以及可读存储介质

    公开(公告)号:CN113378090B

    公开(公告)日:2022-09-06

    申请号:CN202110445408.X

    申请日:2021-04-23

    Abstract: 本发明公开了一种互联网网站相似度分析方法、装置以及可读存储介质,方法包括:从多个未分类的互联网网站中提取文本特征词;将各个未分类的互联网网站的文本特征词分别输入预先获取到的孪生网络编码工具,得到各个未分类的互联网网站的文本向量序列,其中:所述孪生网络编码工具是从训练好的孪生网络中的输入层至权值共享循环神经网络层进行迁移得到,且所述孪生网络的训练是基于从多个已分类的互联网网站中提取的文本特征词实现;将各个未分类的互联网网站的文本向量序列组成的矩阵进行降维处理得到低维弱相关矩阵;对低维弱相关矩阵进行聚类分析,根据聚类分析结果获取所述多个未分类的互联网网站的相似度情况,从而实现互联网网站相似度分析。

Patent Agency Ranking