-
公开(公告)号:CN116720504A
公开(公告)日:2023-09-08
申请号:CN202310433775.7
申请日:2023-04-21
申请人: 华北理工大学
IPC分类号: G06F40/216 , G06F40/284 , G06F40/289 , G06F40/30 , G06F40/242 , G06F16/35
摘要: 本发明提供一种基于自然语言处理的文本数据统计分析系统及方法,涉及数据统计分析技术领域。该基于自然语言处理的文本数据统计分析系统,包括文本数据分类统计、关键词根目录指引和自然语言文本数据分析,所述关键词根目录指引设置在分类统计和自然语言文本数据分析之间,文本数据分类统计包括文本数据收集模块,所述文本数据收集模块连接有语料预处理模块,所述语料预处理模块通过英文文本预处理和中文文本预处理连接有TF‑IDF模型。该分析系统及方法能够对文本数据进行分类预处理,然后进行详细的分析,最终形成图表展现出来,其处理快速,尤其是针对大批量的文本数据处理,节省了人力和物力,提现出的数据更加直观。