一种基于混合格自注意力网络的命名实体识别方法和装置
摘要:
本发明公开了一种基于混合格自注意力网络的命名实体识别方法,包括:S1,将字词对表示的句子特征向量编码为一个维度固定的矩阵,得到混合格结构的字词向量表示;构造自注意力网络以捕获该向量中词向量对字向量的影响,增强每个字向量的特征表示;在BERT的Embedding层融合词特征,通过微调学习过程,学习得到更好的字向量表示;依据BiLSTM‑CRF网络实现实体识别中的实体序列标注任务和解码过程,通过该网络完成对融合后字特征的建模,构建完成基于混合格自注意力网络的实体识别模型。本发明能够捕获全局的词汇信息,生成语义丰富的字向量表示,在多个数据集上提升了中文命名实体识别的精度。
0/0