发明公开
- 专利标题: 一种基于混合格自注意力网络的命名实体识别方法和装置
-
申请号: CN202210172667.4申请日: 2022-02-24
-
公开(公告)号: CN114429132A公开(公告)日: 2022-05-03
- 发明人: 王立松 , 何宗锋 , 刘绍翰 , 刘亮
- 申请人: 南京航空航天大学
- 申请人地址: 江苏省南京市秦淮区御道街29号
- 专利权人: 南京航空航天大学
- 当前专利权人: 南京航空航天大学
- 当前专利权人地址: 江苏省南京市秦淮区御道街29号
- 代理机构: 南京钟山专利代理有限公司
- 代理商 徐燕
- 主分类号: G06F40/295
- IPC分类号: G06F40/295 ; G06F40/279 ; G06F40/242 ; G06N3/04
摘要:
本发明公开了一种基于混合格自注意力网络的命名实体识别方法,包括:S1,将字词对表示的句子特征向量编码为一个维度固定的矩阵,得到混合格结构的字词向量表示;构造自注意力网络以捕获该向量中词向量对字向量的影响,增强每个字向量的特征表示;在BERT的Embedding层融合词特征,通过微调学习过程,学习得到更好的字向量表示;依据BiLSTM‑CRF网络实现实体识别中的实体序列标注任务和解码过程,通过该网络完成对融合后字特征的建模,构建完成基于混合格自注意力网络的实体识别模型。本发明能够捕获全局的词汇信息,生成语义丰富的字向量表示,在多个数据集上提升了中文命名实体识别的精度。