发明公开
CN104834891A 一种中文图像型垃圾邮件过滤方法及系统
无效 - 驳回
- 专利标题: 一种中文图像型垃圾邮件过滤方法及系统
- 专利标题(英): Method and system for filtering Chinese character image type spam
-
申请号: CN201510083460.X申请日: 2015-02-16
-
公开(公告)号: CN104834891A公开(公告)日: 2015-08-12
- 发明人: 刘亚姝 , 徐彬 , 严寒冰 , 张洪刚 , 李思远 , 徐原 , 胡俊 , 高胜 , 何世平 , 饶毓 , 徐晓燕 , 刘婧 , 党向磊 , 李世淙 , 赵宸
- 申请人: 北京建筑大学 , 北京邮电大学 , 国家计算机网络与信息安全管理中心
- 申请人地址: 北京市西城区展览馆1号
- 专利权人: 北京建筑大学,北京邮电大学,国家计算机网络与信息安全管理中心
- 当前专利权人: 北京建筑大学,北京邮电大学,国家计算机网络与信息安全管理中心
- 当前专利权人地址: 北京市西城区展览馆1号
- 代理机构: 工业和信息化部电子专利中心
- 代理商 田俊峰
- 主分类号: G06K9/00
- IPC分类号: G06K9/00 ; G06K9/46 ; G06Q10/10
摘要:
本发明公开了一种中文图像型垃圾邮件过滤方法,包括:在图像背景下提取得到图像中的汉字;使用汉字的关键点对汉字的字符特征进行表示;将字符特征与预先设置的样本库进行匹配,识别出垃圾邮件;对垃圾邮件进行过滤。本发明还公开了一种中文图像型垃圾邮件过滤系统。本发明在中文图像型垃圾邮件过滤中既能保留一定程度的语义信息,又能快速准确的进行识别,本发明可以在只使用很小的特征库下,得到极低的误识别率和很高的准确率。本发明具有更宽松的字符识别要求,能够适应更多变,背景更复杂的图像;对较广泛的图片都能到达较好的效果;在对中文的过滤应用中,本发明从实际垃圾邮件图像中提取少量关键字样本库,使得算法效率大大提高。