-
公开(公告)号:CN115600597A
公开(公告)日:2023-01-13
申请号:CN202211271734.4
申请日:2022-10-18
申请人: 淮阴工学院(CN)
IPC分类号: G06F40/295 , G06F40/30 , G06F18/2413 , G06F18/25 , G06N3/0442 , G06N3/045 , G06N3/0464
摘要: 本发明公开了一种基于注意力机制和词内语义融合的命名实体识别方法、装置、系统及存储介质,方法包括:S1、将句子序列输入子词适调器中匹配到子词嵌入信息;S2、将匹配到的子词嵌入信息输入到CNN语义网络提取子词内部语义特征;S3、利用CHINESE‑BERT模型得到字级别文本表征,将字级别文本表征输入BI‑LSTM网络中学习句子的全局上下文特征;S4、将得到的子词内部语义特征和全局上下文特征输入WordFusionAttention模块中,提取到融入词语内部特征后的关键上下文特征;S5、将融合后的关键上下文特征输入到CRF解码器中预测实体标签。与现有技术相比,本发明提出的方法从而能够有效地提高命名实体的识别精度和缓解未登录词的难识别问题。