发明公开
- 专利标题: 命名实体识别方法、训练方法、装置、电子设备及介质
-
申请号: CN202111608157.9申请日: 2021-12-24
-
公开(公告)号: CN114330344A公开(公告)日: 2022-04-12
- 发明人: 刘同阳 , 王述 , 常万里 , 冯知凡 , 柴春光 , 吕雅娟 , 朱勇
- 申请人: 北京百度网讯科技有限公司
- 申请人地址: 北京市海淀区上地十街10号百度大厦2层
- 专利权人: 北京百度网讯科技有限公司
- 当前专利权人: 北京百度网讯科技有限公司
- 当前专利权人地址: 北京市海淀区上地十街10号百度大厦2层
- 代理机构: 中科专利商标代理有限责任公司
- 代理商 吴晓兵
- 主分类号: G06F40/295
- IPC分类号: G06F40/295 ; G06F40/30 ; G06F40/242 ; G06K9/62
摘要:
本公开提供了一种命名实体识别方法、命名实体识别模型的训练方法、装置、电子设备、存储介质以及程序产品,涉及数据处理技术领域,尤其涉及知识图谱、深度学习等人工智能技术领域,具体涉及医疗、军事、金融、能源、电力、化工、科研、水利、运输、文娱、教育等技术领域。具体实现方案为:确定训练样本,训练样本包括样本文本和待确认样本标注结果序列;利用初始命名实体识别模型处理样本文本,得到样本标签置信度集合序列;基于样本标签置信度集合序列和待确认样本标注结果序列,确定样本文本的目标样本标注结果序列;以及利用样本标签置信度集合序列和目标样本标注结果序列调整初始命名实体识别模型的参数,得到命名实体识别模型。