• 专利标题: 一种基于LDA和随机森林的微博谣言识别方法
  • 专利标题(英): Microblog rumor recognition method based on LDA and random forest
  • 申请号: CN201711483228.0
    申请日: 2017-12-29
  • 公开(公告)号: CN108090046A
    公开(公告)日: 2018-05-29
  • 发明人: 曾子明王婧
  • 申请人: 武汉大学
  • 申请人地址: 湖北省武汉市武昌区珞珈山武汉大学
  • 专利权人: 武汉大学
  • 当前专利权人: 武汉大学
  • 当前专利权人地址: 湖北省武汉市武昌区珞珈山武汉大学
  • 代理机构: 武汉科皓知识产权代理事务所
  • 代理商 薛玲
  • 主分类号: G06F17/27
  • IPC分类号: G06F17/27 G06F17/30
一种基于LDA和随机森林的微博谣言识别方法
摘要:
本发明公开了一种基于LDA和随机森林的微博谣言识别方法,使用爬虫方法从微博官方平台上收集微博数据并进行人工标注;通过文本内容数据处理以及z-score标准化微博数据以计算用户可信度特征和微博影响力特征;通过LDA优化文本内容与主题分布概率以及LDA主题与优化文本内容词语分布概率计算困惑度;进一步构建构建微博特征向量;通过用户可信度特征、微博影响力特征、LDA优化文本内容与主题分布概率作为随机森林模型的输入特征以建立微博谣言分类器。本发明深入挖掘了微博文本语义信息且谣言分类精度高。
公开/授权文献
0/0