发明授权
CN103559175B 一种基于聚类的垃圾邮件过滤系统及方法
失效 - 权利终止
- 专利标题: 一种基于聚类的垃圾邮件过滤系统及方法
-
申请号: CN201310476384.X申请日: 2013-10-12
-
公开(公告)号: CN103559175B公开(公告)日: 2016-08-10
- 发明人: 董守斌 , 许腾 , 张晶 , 张凌 , 隆承志
- 申请人: 华南理工大学
- 申请人地址: 广东省广州市天河区五山路381号
- 专利权人: 华南理工大学
- 当前专利权人: 华南理工大学
- 当前专利权人地址: 广东省广州市天河区五山路381号
- 代理机构: 广州市华学知识产权代理有限公司
- 代理商 蔡茂略
- 主分类号: G06F17/27
- IPC分类号: G06F17/27 ; H04L29/06 ; H04L12/58
摘要:
本发明公开了一种基于聚类的垃圾邮件过滤系统及方法,系统包括聚类模块、邮件训练模块、特征库存储模块、邮件过滤模块;方法包括:S1.1、从邮件备份系统获取训练邮件及未标记邮件;S1.2、聚类预处理模块对邮件进行预处理;S1.3、聚类分析模块对预处理后的邮件划分成不同的类簇;S1.4、类簇中心计算模块计算各类簇的向量表达;S1.5、训练模块对各类簇中的已标记邮件进行学习,更新对应类簇的特征库;S2.1、从邮件系统获取需要过滤的邮件;S2.2、邮件类属性判别模块计算出与该邮件内容最接近的类簇;S2.3、邮件特征提取模块对待判别邮件进行特征提取;S2.4、邮件判别模块依据邮件特征及对应的特征库给出判别结果。本发明具有提取速度快、准确度高、效果好的优点。
公开/授权文献
- CN103559175A 一种基于聚类的垃圾邮件过滤系统及方法 公开/授权日:2014-02-05