-
公开(公告)号:CN119862885A
公开(公告)日:2025-04-22
申请号:CN202311851255.4
申请日:2023-12-29
Applicant: 国网湖北省电力有限公司宜昌供电公司 , 三峡大学
IPC: G06F40/295 , G06N3/045 , G06N3/09
Abstract: 本发明公开了一种融合字形信息的中文嵌套命名实体识别方法,包括以下步骤:步骤1,准备数据集并对数据集中的文本数据进行预处理,获得字型嵌入和字符嵌入;步骤2,设计命名实体识别模型,所述命名实体识别模型,根据步骤1中获取的文本数据的字型嵌入和字符嵌入,对实体进行预测识别;步骤3,使用步骤1中准备的数据集,对命名实体识别模型进行训练;步骤4,使用训练好的命名实体识别模型,进行命名实体识别,完成融合字形信息的中文嵌套命名实体识别。本发明用于解决目前已有的融合字形信息的工作只能解决平面命名实体识别问题,同时能够提高命名实体识别模型的性能。
-
公开(公告)号:CN117875416A
公开(公告)日:2024-04-12
申请号:CN202311827366.1
申请日:2023-12-28
Applicant: 国网湖北省电力有限公司宜昌供电公司 , 三峡大学
IPC: G06N5/022 , G06N3/0442 , G06N3/08
Abstract: 本发明提出了一种实体关系联合抽取方法,包括以下步骤:步骤1,准备数据集并对其中的数据进行预处理;步骤2,构建关系抽取模型;步骤3,使用步骤1中准备的数据集,对步骤2中所述的关系抽取模型进行训练;步骤4,使用训练好的关系抽取模型,对待处理的文本数据进行实体关系联合抽取;所述的关系抽取模型,包括:嵌入模块、主语抽取模块、特征融合模块和关系及相应宾语抽取取模块。本发明改善了在对数据集进行实体关系抽取任务时存在因文本的关系复杂且实体密度大而导致实体识别不准确的问题,有效地解决了实体关系抽取时部分结构特征丢失的问题。
-