基于新闻数据及相关评论信息的一种特定群体发现方法

    公开(公告)号:CN107679069A

    公开(公告)日:2018-02-09

    申请号:CN201710710365.7

    申请日:2017-08-18

    CPC classification number: G06F17/30705 G06F17/30687 G06F17/30867

    Abstract: 本发明提供基于新闻数据及相关评论信息的一种特定群体发现方法。包括以下步骤:采集所针对的媒体中的新闻数据信息及相关评论信息;对新闻数据信息根据其文本内容进行分类,得到不同的类簇;根据相关评论信息,以包含新闻数据信息的评论数最高的类簇作为样本,获取该类簇中新闻数据消息的所有评论及发表评论的用户;通过对所有评论的内容进行分词得到关键词,以出现次数高于一阀值的关键词作为高频词;采用向量空间模型表示评论的内容,通过凝聚式层次对评论的文本聚类,根据聚类结果,得到不同类簇的评论用户参考特征;根据高频词及评论用户参考特征,识别特定群体。能够通过分析评论信息内容快速地智能地发现机器人账号,从而及时进行处理。

Patent Agency Ranking