垃圾短信分类的方法、装置、电子设备及存储介质
摘要:
本发明涉及一种垃圾短信分类的方法、装置、电子设备及存储介质。垃圾短信分类的方法包括步骤:S1、短信文本预处理,从通信网络上下载短信数据集作为单词向量生成的基础数据集合,采用向量空间模型将单词集合形成单词‑文本矩阵;S2、包括话题特征向量和上下文特征向量的短信特征向量生成,话题特征向量通过单词‑文本矩阵做矩阵的奇异值分解后得到,上下文特征向量用于根据中心词预测上下文的概率;S3、神经网络融合与训练,用于处理短信文本的分类器的训练任务,分类器用于区分短信是否为垃圾短信;S4、短信分类判别。依据本发明的垃圾短信分类方法使话题特征和上下文特征能互相弥补对方的缺点,实现多特征融合,从而实现对垃圾短信的精确分类。
0/0