用于使用主题信息识别垃圾消息的系统和方法
Abstract:
用于识别垃圾电子邮件消息的系统和方法。系统可以包括配置为存储多个比例确定规则的规则数据库,配置为存储多个已知矢量的矢量数据库,配置为接收电子邮件消息的消息处理工具,配置为根据所述比例确定规则建立k‑跳过‑n元语法(k‑skip‑n‑gram)词组集合的语法模型(gram)建立工具,配置为接收所述k‑skip‑n‑gram词组集合、并为每个k‑skip‑n‑gram词组建立矢量的矢量建立工具,以及配置为根据每个k‑skip‑n‑gram词组与特定电子邮件消息主题字段主题类别的多个已知矢量的余弦相似性来确定垃圾消息存在阈值、并在所述垃圾消息存在阈值被超过时确定该电子邮件消息包含垃圾消息的垃圾消息识别工具。
Public/Granted literature
Patent Agency Ranking
0/0