一种短文本分类方法、终端设备及存储介质

发明公开

请登陆查看更多内容

专利标题： 一种短文本分类方法、终端设备及存储介质
申请号： CN201911366859.3

申请日： 2019-12-26
公开(公告)号： CN111143560A

公开(公告)日： 2020-05-12
发明人: 邓叶勋 , 赵建强 , 黄剑 , 陈诚 , 刘晓芳 , 郑伟斌
申请人： 厦门市美亚柏科信息股份有限公司
申请人地址： 福建省厦门市软件园二期观日路12号102-402单元
专利权人： 厦门市美亚柏科信息股份有限公司
当前专利权人： 厦门市美亚柏科信息股份有限公司
当前专利权人地址： 福建省厦门市软件园二期观日路12号102-402单元
代理机构： 厦门市精诚新创知识产权代理有限公司
代理商 何家富
主分类号： G06F16/35
IPC分类号： G06F16/35 ; G06N3/04

摘要：

本发明涉及一种短文本分类方法、终端设备及存储介质，该方法中包括：S1：采集多个文本数据并进行特征提取后组成训练集；S2：分别构建基于卷积神经网络和循环神经网络的多个分类模型，计算每个分类模型对训练集中各样本的输出概率；S3：构建三个模型集；S4：根据KS值筛选三个模型集中的两个合并为融合模型库I；S5：设定融合模型库I的样本预测值计算公式；S6：设定损失函数loss；S7：通过训练集对融合模型库I进行迭代训练，通过调整权重参数w1和w2，使得损失函数loss的值最小；S8：通过训练后的融合模型库I对待分类文本数据进行分类。本发明针对短文本数据稀疏、噪声大等问题，通过模型融合策略，有效提高模型应对新数据领域的适应能力。

公开/授权文献

CN111143560B 一种短文本分类方法、终端设备及存储介质公开/授权日：2022-07-01

信息查询

中国专利公布公告 Global Dossier Espacenet

IPC分类:

G	物理
G06	计算；推算或计数
G06F	电数字数据处理（基于特定计算模型的计算机系统入G06N）
G06F16/00	信息检索；数据库结构；文件系统结构
G06F16/30	.•非结构文本数据（文档管理系统入G06F 16/93）
G06F16/35	..••聚类；分类