发明公开
- 专利标题: 垃圾短信分类的方法、装置、电子设备及存储介质
-
申请号: CN202211515975.9申请日: 2022-11-30
-
公开(公告)号: CN116089606A公开(公告)日: 2023-05-09
- 发明人: 李宏图 , 郭心如 , 吴仲文 , 柏京 , 朱运坤 , 崔隆 , 贾泉臻 , 卢丹 , 高千惠
- 申请人: 号百信息服务有限公司
- 申请人地址: 上海市虹口区四川北路61号13-19楼
- 专利权人: 号百信息服务有限公司
- 当前专利权人: 号百信息服务有限公司
- 当前专利权人地址: 上海市虹口区四川北路61号13-19楼
- 代理机构: 上海浦科知识产权代理有限公司
- 代理商 武静
- 主分类号: G06F16/35
- IPC分类号: G06F16/35 ; G06F40/216 ; G06F40/247 ; G06F40/289 ; G06F40/30 ; H04W4/14 ; H04W12/128
摘要:
本发明涉及一种垃圾短信分类的方法、装置、电子设备及存储介质。垃圾短信分类的方法包括步骤:S1、短信文本预处理,从通信网络上下载短信数据集作为单词向量生成的基础数据集合,采用向量空间模型将单词集合形成单词‑文本矩阵;S2、包括话题特征向量和上下文特征向量的短信特征向量生成,话题特征向量通过单词‑文本矩阵做矩阵的奇异值分解后得到,上下文特征向量用于根据中心词预测上下文的概率;S3、神经网络融合与训练,用于处理短信文本的分类器的训练任务,分类器用于区分短信是否为垃圾短信;S4、短信分类判别。依据本发明的垃圾短信分类方法使话题特征和上下文特征能互相弥补对方的缺点,实现多特征融合,从而实现对垃圾短信的精确分类。