发明公开
- 专利标题: 一种文本分类方法及系统
-
申请号: CN201911010301.1申请日: 2019-10-23
-
公开(公告)号: CN110968692A公开(公告)日: 2020-04-07
- 发明人: 张强 , 邓君华 , 赵鲸朋 , 柴博 , 马应龙 , 宋博川 , 贾全烨
- 申请人: 全球能源互联网研究院有限公司 , 国网江苏省电力有限公司 , 国网江苏省电力有限公司电力科学研究院 , 国家电网有限公司
- 申请人地址: 北京市昌平区未来科技城滨河大道18号
- 专利权人: 全球能源互联网研究院有限公司,国网江苏省电力有限公司,国网江苏省电力有限公司电力科学研究院,国家电网有限公司
- 当前专利权人: 全球能源互联网研究院有限公司,国网江苏省电力有限公司,国网江苏省电力有限公司电力科学研究院,国家电网有限公司
- 当前专利权人地址: 北京市昌平区未来科技城滨河大道18号
- 代理机构: 北京三聚阳光知识产权代理有限公司
- 代理商 张琳琳
- 主分类号: G06F16/35
- IPC分类号: G06F16/35 ; G06F16/31 ; G06K9/62 ; G06F40/30
摘要:
本发明公开了一种文本分类方法及系统,方法包括:获取待分类文本的父标签并转化为父标签词索引向量;将父标签词索引向量与文本词索引向量进行父标签嵌入操作得到文本词索引表征,然后进行转化生成待分类文本的语义向量;利用神经元有序的循环神经网络学习语义向量的层次结构,对层次结构的各层参数进行训练输出文本表征;利用多层感知器对文本表征进行非线性操作,获取待分类文本各层标签对应的概率分布;根据文本最后一层标签的概率分布获取文本分类结果。本发明将神经元有序的循环神经网络和多层感知器的组合模型处理大量标签的文本分类任务,涉及的参数少收敛速度快,通过对文本进行逐层的方式,与现有的平面分类器相比,大大提高了分类性能。
公开/授权文献
- CN110968692B 一种文本分类方法及系统 公开/授权日:2023-04-07