一种基于小样本学习的电子邮件作者身份归属识别方法
摘要:
本发明是针对电子邮件作者身份归属的识别方法,检测的对象是电子邮件。本方法应用于电子邮件属主识别领域,其核心是针对电子邮件头部,在筛选出有价值的头部字段后,通过统计算法计算这些字段的特征。针对电子邮件正文,通过Word2Vec算法构建单词级别的文本表征,通过CNN算法构建字符级别文本表征,利用BiLSTM算法与自注意力机制捕获邮件作者书写习惯特征。将三部分特征进行融合得到新的表征,利用动态路由算法构建作者身份的类别向量,最后使用神经张量计算匿名邮件与作者类向量间的相似性,依据相似性分数为匿名邮件样本分配标签,最终实现作者的识别,该方法可以解决网络匿名攻击邮件的归属判定,为攻击溯源提供支撑。
0/0