-
公开(公告)号:CN113011163A
公开(公告)日:2021-06-22
申请号:CN202110222535.3
申请日:2021-02-27
Applicant: 中国人民解放军战略支援部队信息工程大学 , 网络通信与安全紫金山实验室
IPC: G06F40/216 , G06F40/242 , G06F40/284 , G06F40/30 , G06F16/35 , G06K9/62 , G06N3/04 , G06N3/08
Abstract: 本发明属于自然语言处理技术领域,特别涉及一种基于深度学习模型的复合文本多分类方法及系统,包含:将复合文本转换至词语粒度级的文本表示,对转换后的词语粒度级文本表示进行预处理,并通过词嵌入方法表示为词向量;将词向量作为深度学习模型输入,通过模型CNN卷积层提取文本特征,选取卷积后向量,并保留全局部分序列关联信息,通过模型self‑attention层为文本特征向量附加权重并进行等长向量序列拼接,利用模型LSTM循环层提取文本特征向量;通过模型池化层对文本特征向量进行平均化操作,并利用softmax分类器获取输入的文本类别概率,依据概率大小来获取文本分类结果。本发明可解决复合文本精确多分类问题,满足自然语言文本多分类预测识别的实际应用。