-
公开(公告)号:CN111708886A
公开(公告)日:2020-09-25
申请号:CN202010527263.3
申请日:2020-06-11
IPC分类号: G06F16/35 , G06F16/951 , G06F16/955 , G06F40/289
摘要: 本发明属于数据库技术领域,涉及舆情分析技术领域,尤其是一种基于数据驱动的舆情分析终端及舆情文本分析方法,包括终端本体,所述终端本体内安装有存储器和处理器,其特征在于:所述终端内置计算机程序,该计算机程序包括爬虫模块、文本预处理模块和情感判定模块,所述爬虫模块用于对舆情数据进行收集,文本预处理模块用于对字符串进行预处理,情感判定模块用于对文本进行情感分析。基于上述分析终端配套设计一种可将网络文本数据通过中文分词、去停用词、不平衡语料处理、特征选择等算法配合进行处理,并最终实现舆情识别的舆情分析终端和舆情文本分析方法。