-
公开(公告)号:CN119862885A
公开(公告)日:2025-04-22
申请号:CN202311851255.4
申请日:2023-12-29
Applicant: 国网湖北省电力有限公司宜昌供电公司 , 三峡大学
IPC: G06F40/295 , G06N3/045 , G06N3/09
Abstract: 本发明公开了一种融合字形信息的中文嵌套命名实体识别方法,包括以下步骤:步骤1,准备数据集并对数据集中的文本数据进行预处理,获得字型嵌入和字符嵌入;步骤2,设计命名实体识别模型,所述命名实体识别模型,根据步骤1中获取的文本数据的字型嵌入和字符嵌入,对实体进行预测识别;步骤3,使用步骤1中准备的数据集,对命名实体识别模型进行训练;步骤4,使用训练好的命名实体识别模型,进行命名实体识别,完成融合字形信息的中文嵌套命名实体识别。本发明用于解决目前已有的融合字形信息的工作只能解决平面命名实体识别问题,同时能够提高命名实体识别模型的性能。