一种面向电力规划评审领域的命名实体识别方法

    公开(公告)号:CN114154505A

    公开(公告)日:2022-03-08

    申请号:CN202111485849.9

    申请日:2021-12-07

    Abstract: 本发明公开了一种面向电力规划评审领域的命名实体识别方法,包括S1:根据样本语料数据集特征,设立多个刻画实体不同性质的实体标签,获得分词后的样本语料;S2:将分词后的样本语料加载到Glove模型以训练词向量,按位置拼接后得到文本序列向量矩阵;S3:利用多尺度卷积网络对文本序列向量矩阵卷积后重组池化,提取出序列中词粒度的词汇信息;S4:将以文本序列向量矩阵为输入的BiLSTM网络中前向LSTM和后向LSTM末尾状态进行拼接,提取出序列中句粒度的词缀信息;S5:利用Cross‑Transformer模块对序列中词粒度的词汇信息和序列中句粒度的词缀信息进行融合,最后通过CRF层完成命名实体识别。本发明在一定程度上提高了电力规划评审领域命名实体识别的效率。

Patent Agency Ranking