- 专利标题: 一种分词、词性标注和命名实体识别的联合词法分析方法
-
申请号: CN202210715424.0申请日: 2022-06-22
-
公开(公告)号: CN114970536B公开(公告)日: 2024-08-16
- 发明人: 线岩团 , 朱叶芬 , 文永华 , 王红斌
- 申请人: 昆明理工大学
- 申请人地址: 云南省昆明市五华区学府路253号
- 专利权人: 昆明理工大学
- 当前专利权人: 昆明理工大学
- 当前专利权人地址: 云南省昆明市五华区学府路253号
- 代理机构: 云南盛恒知识产权代理有限公司
- 代理商 马斌
- 主分类号: G06F40/295
- IPC分类号: G06F40/295 ; G06F40/242 ; G06F40/211 ; G06F40/30 ; G06F16/33 ; G06F16/35 ; G06F16/36 ; G06F18/24 ; G06N3/0455 ; G06N3/08
摘要:
本发明公开一种分词、词性标注和命名实体识别的联合词法分析方法,将分词和词性标注任务分解为候选词语检测和词性类别预测两个子任务,将实体识别任务分解为候选实体检测和实体类别预测两个子任务,并采用统一的神经网络模型对四个任务进行联合学习;同时,对不同任务之间的参数进行共享。本发明用高准确率的分词改善了词性标注任务和实体识别任务中的词边界检测问题,并且可以通过使用词性标注信息来提高分词精度。利用分词、词性标注和命名实体识别之间的高关联性进行联合学习,提高了模型性能。
公开/授权文献
- CN114970536A 一种分词、词性标注和命名实体识别的联合词法分析方法 公开/授权日:2022-08-30