- 专利标题: 基于RoBERTa-BiGRU-LAN模型的中文命名实体识别方法及装置
-
申请号: CN202010281724.3申请日: 2020-04-11
-
公开(公告)号: CN111626056A公开(公告)日: 2020-09-04
- 发明人: 李邵梅 , 胡新棒 , 黄瑞阳 , 李辉 , 胡楠 , 郑洪浩
- 申请人: 中国人民解放军战略支援部队信息工程大学
- 申请人地址: 河南省郑州市高新区科学大道62号
- 专利权人: 中国人民解放军战略支援部队信息工程大学
- 当前专利权人: 中国人民解放军战略支援部队信息工程大学
- 当前专利权人地址: 河南省郑州市高新区科学大道62号
- 代理机构: 郑州大通专利商标代理有限公司
- 代理商 石丹丹
- 主分类号: G06F40/295
- IPC分类号: G06F40/295 ; G06F40/284 ; G06N3/04 ; G06N3/08
摘要:
本发明属于命名实体识别技术领域,特别涉及一种基于RoBERTa-BiGRU-LAN模型的中文命名实体识别方法及装置,该方法包括将待处理中文语料转换为字向量序列;将获得的字向量序列输入RoBERTa-BiGRU-LAN模型的第一层BiGRU-LAN,获取融合局部信息的编码序列;将上面获得的编码序列输入RoBERTa-BiGRU-LAN模型的第二层BiGRU-LAN,获取融合全局信息的注意力分布;根据上面获得的注意力分布得到命名实体识别结果。本发明改进字嵌入方法更好地进行中文表征,同时将BiLSTM-CRF改进为BiGRU-LAN,减少了模型的参数,降低模型复杂度,节省了训练时间。
公开/授权文献
- CN111626056B 基于RoBERTa-BiGRU-LAN模型的中文命名实体识别方法及装置 公开/授权日:2023-04-07