-
公开(公告)号:CN117764067A
公开(公告)日:2024-03-26
申请号:CN202311629205.1
申请日:2023-11-30
Applicant: 北京市遥感信息研究所
IPC: G06F40/289 , G06F18/241 , G06F18/214 , G06F40/30
Abstract: 本发明提出一种基于类别名称感知分解式框架的少样本命名实体识别方法,包括,获取原始数据集,对原始数据集中的文本与标签信息进行预处理,并划分训练集、验证集和测试集;构建类别名称感知分解式框架模型,将训练集和验证集输入到类别名称感知分解式框架模型中进行训练,并在验证集上进行评价指标的计算,保存最优的模型;从测试集中对每个类随机选取样本作为支撑集,利用支撑集对最优的模型进行微调;利用支撑集和微调后的模型计算得到类别名称感知的跨度过滤阈值;根据微调后的模型以及跨度过滤阈值对测试集中的样本进行预测。