一种报文信息源抽取方法及其系统

    公开(公告)号:CN103778200B

    公开(公告)日:2017-08-08

    申请号:CN201410010836.X

    申请日:2014-01-09

    IPC分类号: G06F17/30

    摘要: 本发明公开了一种报文信息源抽取方法及其系统,该方法通过匹配信息源抽取规则库的关键词提取报文中的信息源,并匹配信息源抽取规则库的规则判断信息源类型,该方法包括:报文解析步骤和信息源抽取步骤,报文解析步骤用于根据输入的文本,提取文本中的字符,并对字符进行断句处理为不同分句,信息源抽取步骤为根据信息源抽取规则库对分句进行关键词匹配,对分句抽取有用要素序列,并在有用要素序列上,提取信息源,并通过匹配信息源抽取规则库的规则判断信息源类型。

    基于社交网络的用户群体消息传播异常分析方法及装置

    公开(公告)号:CN109145109B

    公开(公告)日:2022-06-03

    申请号:CN201710464424.7

    申请日:2017-06-19

    摘要: 本发明涉及一种基于社交网络的用户群体消息传播异常分析方法和装置,包括:获取在线社交网络中用户群体的历史聊天记录,根据预先设定的时间跨度,获取历史聊天记录在时间跨度内用户群体中所有用户所发布的消息,作为消息集合;对于消息集合,根据预先设定的时间范围统计用户群体在每个时间范围内所发布的消息总数;基于时序相关性的特征提取法,对每个消息总数的特征进行提取,并将提取结果集合为样本集合;根据消息总数并采用聚类算法为样本集合对样本集合进行聚类,生成异常样本;根据异常样本判定其所在的用户群体存在消息传播异常。由此本发明能够应对数据涌发现象,同时算法直观简单,准确率更高,且本发明应用场景广泛。

    基于多次单类型采集结果的综合异常判断的系统

    公开(公告)号:CN108429649B

    公开(公告)日:2020-11-06

    申请号:CN201810244277.7

    申请日:2018-03-23

    IPC分类号: H04L12/24

    摘要: 本发明公开了一种基于多次单类型采集结果的综合异常判断系统,涉及网络预警技术领域。所述系统包括:阈值生成单元和异常判断单元;所述阈值生成单元,在从被采集系统上获取到的采集数据的基础上,计算判断阈值;所述异常判断单元,在所述判断阈值和所述采集数据的基础上,判断被采集系统运行是正常还是异常。本发明所述系统对采集到的数据进行多种方式进行判断,从而在不接触被监测系统后台日志或硬件数据的情况下准确识别出被检测系统的运行状况,解决了因使用平均值计算抗干扰性太弱,固定阈值判断性能太差,阈值波动范围设置方案单一且低效的问题。

    一种针对千万级规模新闻评论的观点挖掘方法

    公开(公告)号:CN104778209B

    公开(公告)日:2018-04-27

    申请号:CN201510111752.X

    申请日:2015-03-13

    IPC分类号: G06F17/30

    摘要: 本发明公开了一种针对千万级规模新闻评论的观点挖掘方法。具体步骤如下:1)、统计千万级规模新闻评论的数量;2)、判断该数量是否大于或等于阈值K,如果是不予处理,否则进入步骤三;3)、利用中文分词工具,对数量小于阈值K的新闻标题和评论进行分词,进行词性标注;4)、根据分词结果对新闻评论聚类,得到类别标签;5)、对新闻评论进行关键词对提取;6)、统计新闻评论的比例和混杂度;7)、根据关键词对筛选并提取代表性文本。本发明利用中文分词工具,考虑汉语语言的用法和搭配关系,结合新闻标题的作用,处理千万级规模的新闻评论,具有高效性、鲁棒性和易用性等优点。