-
公开(公告)号:CN101594312B
公开(公告)日:2012-12-26
申请号:CN200810044484.4
申请日:2008-05-30
Applicant: 电子科技大学
Abstract: 本发明涉及互联网技术,公开了一种邮件行为特征库生成方法、垃圾邮件判断方法、垃圾邮件特征库更新方法。从本发明实施提供的以上技术方案可以看出,本发明实施采用分类已知的邮件的行为特征库生成方法,并使用生成的特征对分类未知的邮件进行判断。在识别未分类邮件时,除了计算未知邮件与抗体库中已知垃圾邮件的行为特征相似度外,还设置分数集。通过计算总分数,查看未知邮件其行为特征趋近于垃圾邮件的程度。通过双重标准可以更准确的识别垃圾邮件。在数据库更新时,用已经识别垃圾邮件,通过克隆变异算法实现抗体库的更新,更能适应一定时期内垃圾邮件行为特征变化趋势和垃圾邮件变化趋势。
-
公开(公告)号:CN101594312A
公开(公告)日:2009-12-02
申请号:CN200810044484.4
申请日:2008-05-30
Applicant: 电子科技大学
Abstract: 本发明涉及互联网技术,公开了一种邮件行为特征库生成方法及装置、垃圾邮件判断方法、装置及系统、垃圾邮件特征库更新方法及装置。从本发明实施例提供的以上技术方案可以看出,本发明实施例采用分类已知的邮件的行为特征库生成方法,并使用生成的特征对分类未知的邮件进行判断。在识别未分类邮件时,除了计算未知邮件与抗体库中已知垃圾邮件的行为特征相似度外,还设置分数集。通过计算总分数,查看未知邮件其行为特征趋近于垃圾邮件的程度。通过双重标准可以更准确的识别垃圾邮件。在数据库更新时,用已经识别垃圾邮件,通过克隆变异算法实现抗体库的更新,更能适应一定时期内垃圾邮件行为特征变化趋势和垃圾邮件变化趋势。
-
公开(公告)号:CN101594313A
公开(公告)日:2009-12-02
申请号:CN200810044485.9
申请日:2008-05-30
Applicant: 电子科技大学
Abstract: 本发明涉及文本处理技术领域,尤其是一种垃圾邮件的判断、分类、过滤方法及系统。此系统分成两个子系统,包括:潜在语义空间生成子系统和邮件判断、分类、过滤子系统。其中潜在语义空间子系统包括:中文和英文分词模块;词语文档矩阵生成模块、权重计算模块、词语文档矩阵奇异值分解模块、语义空间更新模块。邮件判断、分类、过滤子系统的包括:待判断的邮件中文和英文分词模块、将文本邮件映射到潜在语义空间、语义空间中文档向量之间的相似度计算、根据相似度判断、分类、过滤邮件。使用本发明提供的实施例可以对垃圾邮件进行判断,从而过滤垃圾邮件,并且能够快速、高效的过滤垃圾邮件。
-
-