一种网络不良信息的过滤方法及装置

    公开(公告)号:CN102567304B

    公开(公告)日:2014-02-26

    申请号:CN201010621142.1

    申请日:2010-12-24

    CPC classification number: G06F17/24 G06F17/2705 G06F17/30699 G06F17/30867

    Abstract: 本发明公开了一种网络不良信息的过滤方法以及装置,涉及计算机信息处理及信息过滤技术领域。其中,本发明实施例提供的一种网络不良信息的过滤方法,包括:获取待过滤文本信息、系统预研模型信息以及用户反馈模型信息;对所述待过滤文本信息进行预处理;将所述预处理后的待过滤文本信息与所述系统预研模型信息进行特征信息匹配,给出第一匹配结果;将所述预处理后的待过滤文本信息与所述用户反馈模型信息进行特征信息匹配,给出第二匹配结果;根据所述第一匹配结果与所述第二匹配结果,对所述待过滤文本信息进行过滤处理。采用本发明实施例能够实现提高不良信息自动过滤性能,且可以实现系统信息自动更新。

    一种网络不良信息的过滤方法及装置

    公开(公告)号:CN102567304A

    公开(公告)日:2012-07-11

    申请号:CN201010621142.1

    申请日:2010-12-24

    CPC classification number: G06F17/24 G06F17/2705 G06F17/30699 G06F17/30867

    Abstract: 本发明公开了一种网络不良信息的过滤方法以及装置,涉及计算机信息处理及信息过滤技术领域。其中,本发明实施例提供的一种网络不良信息的过滤方法,包括:获取待过滤文本信息、系统预研模型信息以及用户反馈模型信息;对所述待过滤文本信息进行预处理;将所述预处理后的待过滤文本信息与所述系统预研模型信息进行特征信息匹配,给出第一匹配结果;将所述预处理后的待过滤文本信息与所述用户反馈模型信息进行特征信息匹配,给出第二匹配结果;根据所述第一匹配结果与所述第二匹配结果,对所述待过滤文本信息进行过滤处理。采用本发明实施例能够实现提高不良信息自动过滤性能,且可以实现系统信息自动更新。

    舆情事件的实体关系抽取方法和装置

    公开(公告)号:CN103207860B

    公开(公告)日:2017-08-25

    申请号:CN201210007694.2

    申请日:2012-01-11

    Abstract: 本发明提供了一种舆情事件的实体关系抽取方法,包括:对舆情事件的文本集合进行分词;从分词得到的切分单元中抽取主题短语;基于聚类方法从主题短语中获取子主题;从子主题中获取实体关系。本发明还提供了一种舆情事件的实体关系抽取装置,包括:分词模块,用于对舆情事件的文本集合进行分词;主题短语模块,用于从分词得到的切分单元中抽取主题短语;子主题模块,用于基于聚类方法从主题短语中获取子主题;实体关系模块,用于从子主题中获取实体关系。本发明提高了抽取舆情事件的实体关系的性能。

    用于内容资源数据库的日期检索方法和装置

    公开(公告)号:CN103136274A

    公开(公告)日:2013-06-05

    申请号:CN201110396422.1

    申请日:2011-12-02

    Abstract: 本发明提供了一种用于内容资源数据库的日期检索方法,包括:将待检索日期范围与内容资源数据库的多个日期索引子库的日期范围进行相交运算;对交集非空的多个日期索引子库检索待检索日期范围;将检索到的记录提交给用户。本发明提供了一种用于内容资源数据库的日期检索装置,包括:运算模块,用于将待检索日期范围与内容资源数据库的多个日期索引子库的日期范围进行相交运算;检索模块,用于对交集非空的多个日期索引子库检索待检索日期范围;提交模块,用于将检索到的记录提交给用户。本发明缩短了对内容资源数据库的日期检索的时间。

    舆情数据聚类方法和舆情数据聚类系统

    公开(公告)号:CN106156192A

    公开(公告)日:2016-11-23

    申请号:CN201510191694.6

    申请日:2015-04-21

    Abstract: 本发明提出了一种舆情数据聚类方法和一种舆情数据聚类系统,其中,所述舆情数据聚类方法包括:对社交网络中的当前数据进行冗余过滤,以获取非冗余数据;对所述非冗余数据进行分析,以在所述非冗余数据中确定相关舆情数据;对所述相关舆情数据进行聚类,以在所述相关舆情数据中确定目标舆情数据。通过本发明的技术方案,通过对社交网站中的海量数据进行增量式的聚类,不仅可以使聚类的处理速度可以达到实时性的要求,还可以调整聚类结果,从而避免了聚类出局部片断式的聚类结果,进而提高了聚类结果的准确性。

    一种微博用户身份识别方法及系统

    公开(公告)号:CN103914494B

    公开(公告)日:2017-05-17

    申请号:CN201310008156.X

    申请日:2013-01-09

    CPC classification number: G06F17/3053 G06F17/30598 G06F21/316

    Abstract: 本发明提供一种微博用户身份识别方法及系统,所述方法包括:获取待识别用户行为数据以及用户行为的特征库信息;预处理所述获取的待识别用户行为数据;将所述预处理后的用户行为数据,进行语义单元重构;获取所述语义单元的属性信息以及其对应的权重;根据所述语义单元的属性信息以及其对应的权重,获取所述待识别用户行为特征;将所述待识别用户行为特征与用户行为的特征库信息中的每个特征类型进行比较;当所述待识别用户行为特征与所述用户行为的特征库信息中的一个特征类型的相似度超过预设阈值,则所述待识别用户身份确定。采用本发明提供的微博用户身份识别方法及系统可以有效提高微薄用户身份识别的准确性及实时性。

Patent Agency Ranking