一种基于NTBC-net算法的电力分词模型
摘要:
本发明提供一种基于NTBC‑net算法的电力分词模型,由数字上下文强化编码,具有重要性的全局特征编码,具有重要性的局部特征编码和NTBC‑net输出部分组成,所述数字上下文强化编码先判断输入文本中是否包含数字,如包含则对数字信息进行增强表示,所述具有重要性的全局特征编码包括BiSTM模块和自注意力模块1,所述具有重要性的局部特征编码包括CNN模块和自注意力模块2,所述NTBC‑net输出部分利用条件随机场处理得到文本中每个字的标签结果,本发明将电力知识相关长句切分为头实体和意图两部分,同时对电力语句内的数字信息采取数字上下文强化编码,为电力知识图谱的匹配提供了便利。
0/0