一种多标签文本分类方法及系统
摘要:
本发明公开了一种多标签文本分类方法及系统,包括:针对待分类文档确定待考核标签子集;对待分类文档进行分词处理;获取当前计算字词相应于当前考核标签子集中各标签的似然度;对当前计算字词相应于当前考核标签子集中各标签的似然度进行线性加权,得到当前计算字词相应于当前考核标签子集的加权似然度;确定进行线性加权的各加权系数,使得所有字词的加权似然度的连乘积最大,并将最大的连乘积作为待分类文档相应于当前考核标签子集的似然度;在待考核标签子集中,选取使得后验概率最大的标签子集作为待分类文档的分类结果。本发明的多标签分类方法及系统相对现有多标签分类方法及系统兼具总体性能高及计算量小的特点。
公开/授权文献
0/0