发明公开
- 专利标题: 基于轻量化图卷积网络的层次文本分类方法及系统
-
申请号: CN202410664829.5申请日: 2024-05-27
-
公开(公告)号: CN118503425A公开(公告)日: 2024-08-16
- 发明人: 吴晓明 , 刘腾 , 刘祥志 , 侯冬冬 , 满佳政 , 董云峰
- 申请人: 山东省计算中心(国家超级计算济南中心) , 齐鲁工业大学(山东省科学院) , 山东山科智能科技有限公司
- 申请人地址: 山东省济南市历下区科院路19号; ;
- 专利权人: 山东省计算中心(国家超级计算济南中心),齐鲁工业大学(山东省科学院),山东山科智能科技有限公司
- 当前专利权人: 山东省计算中心(国家超级计算济南中心),齐鲁工业大学(山东省科学院),山东山科智能科技有限公司
- 当前专利权人地址: 山东省济南市历下区科院路19号; ;
- 代理机构: 济南圣达知识产权代理有限公司
- 代理商 黄海丽
- 主分类号: G06F16/35
- IPC分类号: G06F16/35 ; G06N3/042 ; G06N3/0464 ; G06N3/08
摘要:
本发明公开了基于轻量化图卷积网络的层次文本分类方法及系统,获取待分类的新闻正文文本数据,和新闻正文文本数据对应的带有层次结构的标签;将获取的数据,输入到训练后的文本分类网络中,输出文本分类结果;训练后的文本分类网络,采用第一BERT编码器对待分类的新闻正文文本数据进行编码处理,得到正文文本特征表示;采用轻量化图卷积网络对带有层次结构的标签进行特征提取,得到标签文本表示;采用注意力机制层对正文文本表示和标签文本表示进行处理,得到标签感知正样本;采用第二BERT编码器,对标签感知正样本进行处理,得到标签感知正样本表示;采用分类器,对正文文本特征表示和标签感知正样本表示进行分类,得到文本分类结果。