发明公开
- 专利标题: 一种基于NTBC-net算法的电力分词模型
-
申请号: CN202410909488.3申请日: 2024-07-08
-
公开(公告)号: CN118898250A公开(公告)日: 2024-11-05
- 发明人: 汪勋婷 , 徐斌 , 高博 , 汤伟 , 丁津津 , 袁伟博 , 李圆智 , 张小红
- 申请人: 国网安徽省电力有限公司电力科学研究院 , 国网安徽省电力有限公司宣城供电公司
- 申请人地址: 安徽省合肥市经济技术开发区紫云路299号;
- 专利权人: 国网安徽省电力有限公司电力科学研究院,国网安徽省电力有限公司宣城供电公司
- 当前专利权人: 国网安徽省电力有限公司电力科学研究院,国网安徽省电力有限公司宣城供电公司
- 当前专利权人地址: 安徽省合肥市经济技术开发区紫云路299号;
- 代理机构: 荆门市鑫然知识产权代理事务所
- 代理商 王锋
- 主分类号: G06F40/289
- IPC分类号: G06F40/289 ; G06N3/0464 ; G06N3/0442 ; G06N3/045 ; G06N3/0499 ; G06F16/36 ; G06N3/048 ; G06F40/126
摘要:
本发明提供一种基于NTBC‑net算法的电力分词模型,由数字上下文强化编码,具有重要性的全局特征编码,具有重要性的局部特征编码和NTBC‑net输出部分组成,所述数字上下文强化编码先判断输入文本中是否包含数字,如包含则对数字信息进行增强表示,所述具有重要性的全局特征编码包括BiSTM模块和自注意力模块1,所述具有重要性的局部特征编码包括CNN模块和自注意力模块2,所述NTBC‑net输出部分利用条件随机场处理得到文本中每个字的标签结果,本发明将电力知识相关长句切分为头实体和意图两部分,同时对电力语句内的数字信息采取数字上下文强化编码,为电力知识图谱的匹配提供了便利。