发明授权
CN110688484B 一种基于不平衡贝叶斯分类的微博敏感事件言论检测方法
失效 - 权利终止
摘要:
本发明公开一种基于不平衡贝叶斯分类的微博敏感事件言论检测方法,包括:S1、选取需要检测的微博言论数据集,通过文本特征处理构建不平衡数据集,构建分类模型;指定分类模型在参数ω上的先验分布,对参数ω随机初始化,得到初始参数向量ω0;S2、计算参数为ω0的分类模型对各类别子数据集的间隔似然值;S3、计算分类模型在参数ω0上的后验概率;S4、采样新参数点;S5、记录采样到的参数序列;S6、分类模型计算待测言论特征属于各类别的概率分布向量p,预测待测言论特征的类别为p中概率最高的类别;本发明不需大量数据支撑训练过程,克服了异常类样本过拟合的问题,从而有效提高了异常类言论数量过少时数据集的分类精度。
公开/授权文献
- CN110688484A 一种基于不平衡贝叶斯分类的微博敏感事件言论检测方法 公开/授权日:2020-01-14