发明公开
CN101393555A 一种垃圾博客检测方法
无效 - 撤回
- 专利标题: 一种垃圾博客检测方法
- 专利标题(英): Rubbish blog detecting method
-
申请号: CN200810120972.9申请日: 2008-09-09
-
公开(公告)号: CN101393555A公开(公告)日: 2009-03-25
- 发明人: 陈纯 , 卜佳俊 , 张峰 , 仇光 , 郑淼
- 申请人: 浙江大学
- 申请人地址: 浙江省杭州市西湖区浙大路38号
- 专利权人: 浙江大学
- 当前专利权人: 浙江大学
- 当前专利权人地址: 浙江省杭州市西湖区浙大路38号
- 代理机构: 杭州求是专利事务所有限公司
- 代理商 林怀禹
- 主分类号: G06F17/30
- IPC分类号: G06F17/30
摘要:
本发明公开了一种垃圾博客检测方法。本发明是通过分析网络垃圾的作弊技术,针对垃圾博客的本质属性,运用二元分类的文本分类的技术,围绕博客文本内容特征、博客页面链接特征和博客文本时间分布特征等三个角度进行方法设计。本发明是建立在对博客网页内容全面分析的基础上,对博客的特征提取工作进行了优化,从而保证了对垃圾博客分类更高的准确率。