-
公开(公告)号:CN103150335A
公开(公告)日:2013-06-12
申请号:CN201310039173.X
申请日:2013-01-25
申请人: 河南理工大学
IPC分类号: G06F17/30
摘要: 本发明提出一种基于联合聚类的煤矿舆情监测系统,该系统包括数据采集与内容过滤模块、数据预处理模块、煤矿舆情分析模块和舆情结果呈现模块。煤矿舆情分析模块是该系统中的核心模块,采用了Web数据挖掘领域中的聚类算法,发明人在基于信息瓶颈理论的增量聚类方法的基础上,充分考虑了部分特征以及特征和特征间的相关性,从而提高了聚类结果的准确性和精确性。该系统面向微博、博客、论坛以及门户网站等网络资源,所采集的信息经去重、中文分词、停用词过滤等数据预处理步骤后,建立煤矿舆情库,同时基于文本分类、文本聚类等数据挖掘算法进行热点发现以及舆情热度分析,最后以数据性图标以及舆情报表的形式给出监测结果。