-
公开(公告)号:CN113157908B
公开(公告)日:2023-05-02
申请号:CN202110303027.8
申请日:2021-03-22
Applicant: 北京邮电大学
IPC: G06F16/34 , G06F16/35 , G06F40/216 , G06F40/284
Abstract: 本发明提供了一种展示社交媒体热点子话题的文本可视化方法,包括如下步骤:步骤S101,输入社交媒体文本语料集,得到文档词项矩阵;步骤S102,计算词与词之间的共现后验概率矩阵;步骤S103,计算未在原始短文本中出现的词可以填充到该文本中的概率,将概率最大的N个词填充到原始短文本后;步骤S104,文本聚类;步骤S105,对步骤S104得到的各个文本簇分别提取关键短语和关键语句;步骤S106,基于关键短语对各个文本簇分别生成词云图;步骤S107,使用FoamTree组合各个词云图进行文本可视化;步骤S108,使用JavaScript监听到维诺图某个区域被点击时展示对应文本簇的关键语句。采用本发明的方法,可以清楚地区分出社交媒体文本语料集的各个子话题,对社交媒体舆情监测具有一定意义。
-
公开(公告)号:CN113157908A
公开(公告)日:2021-07-23
申请号:CN202110303027.8
申请日:2021-03-22
Applicant: 北京邮电大学
IPC: G06F16/34 , G06F16/35 , G06F40/216 , G06F40/284
Abstract: 本发明提供了一种展示社交媒体热点子话题的文本可视化方法,包括如下步骤:步骤S101,输入社交媒体文本语料集,得到文档词项矩阵;步骤S102,计算词与词之间的共现后验概率矩阵;步骤S103,计算未在原始短文本中出现的词可以填充到该文本中的概率,将概率最大的N个词填充到原始短文本后;步骤S104,文本聚类;步骤S105,对步骤S104得到的各个文本簇分别提取关键短语和关键语句;步骤S106,基于关键短语对各个文本簇分别生成词云图;步骤S107,使用FoamTree组合各个词云图进行文本可视化;步骤S108,使用JavaScript监听到维诺图某个区域被点击时展示对应文本簇的关键语句。采用本发明的方法,可以清楚地区分出社交媒体文本语料集的各个子话题,对社交媒体舆情监测具有一定意义。
-