一种垃圾博客检测方法
摘要:
本发明公开了一种垃圾博客检测方法。本发明是通过分析网络垃圾的作弊技术,针对垃圾博客的本质属性,运用二元分类的文本分类的技术,围绕博客文本内容特征、博客页面链接特征和博客文本时间分布特征等三个角度进行方法设计。本发明是建立在对博客网页内容全面分析的基础上,对博客的特征提取工作进行了优化,从而保证了对垃圾博客分类更高的准确率。
0/0