发明公开
- 专利标题: 一种短文本分类方法、终端设备及存储介质
-
申请号: CN201911366859.3申请日: 2019-12-26
-
公开(公告)号: CN111143560A公开(公告)日: 2020-05-12
- 发明人: 邓叶勋 , 赵建强 , 黄剑 , 陈诚 , 刘晓芳 , 郑伟斌
- 申请人: 厦门市美亚柏科信息股份有限公司
- 申请人地址: 福建省厦门市软件园二期观日路12号102-402单元
- 专利权人: 厦门市美亚柏科信息股份有限公司
- 当前专利权人: 厦门市美亚柏科信息股份有限公司
- 当前专利权人地址: 福建省厦门市软件园二期观日路12号102-402单元
- 代理机构: 厦门市精诚新创知识产权代理有限公司
- 代理商 何家富
- 主分类号: G06F16/35
- IPC分类号: G06F16/35 ; G06N3/04
摘要:
本发明涉及一种短文本分类方法、终端设备及存储介质,该方法中包括:S1:采集多个文本数据并进行特征提取后组成训练集;S2:分别构建基于卷积神经网络和循环神经网络的多个分类模型,计算每个分类模型对训练集中各样本的输出概率;S3:构建三个模型集;S4:根据KS值筛选三个模型集中的两个合并为融合模型库I;S5:设定融合模型库I的样本预测值计算公式;S6:设定损失函数loss;S7:通过训练集对融合模型库I进行迭代训练,通过调整权重参数w1和w2,使得损失函数loss的值最小;S8:通过训练后的融合模型库I对待分类文本数据进行分类。本发明针对短文本数据稀疏、噪声大等问题,通过模型融合策略,有效提高模型应对新数据领域的适应能力。
公开/授权文献
- CN111143560B 一种短文本分类方法、终端设备及存储介质 公开/授权日:2022-07-01