发明公开
- 专利标题: 一种合同文本命名实体识别方法及系统
-
申请号: CN202111644252.4申请日: 2021-12-29
-
公开(公告)号: CN114417872A公开(公告)日: 2022-04-29
- 发明人: 常远 , 孔雷 , 孟庆磊 , 孟笛
- 申请人: 航天科工网络信息发展有限公司
- 申请人地址: 湖北省武汉市临空港经济技术开发区五环大道666号(21)
- 专利权人: 航天科工网络信息发展有限公司
- 当前专利权人: 航天科工网络信息发展有限公司
- 当前专利权人地址: 湖北省武汉市临空港经济技术开发区五环大道666号(21)
- 代理机构: 中国航天科工集团公司专利中心
- 代理商 葛鹏
- 主分类号: G06F40/295
- IPC分类号: G06F40/295 ; G06F40/211 ; G06F40/253 ; G06F40/30 ; G06N3/04 ; G06N3/08
摘要:
本发明涉及文本识别技术领域,具体涉及一种合同文本命名实体识别方法及模型。本发明的方法包括获取合同文本的语句序列;提取合同文本的语句序列的语法及语义特征,得到合同文本的词序列特征向量;对文本的词序列特征向量进行特征提取和特征融合,得到文本的预测标签;以及对预测标签进行修正处理,输出合同文本标签步骤。本发明的方法步骤均通过采用人工智能的深度学习方法识别合同文本的实体信息,不再需要耗费大量人力制定大量规则,且能够自动、高效识别出输入的合同文本中的命名实体信息,为后续文本分类、数据脱敏等任务提供准确的实体标签。