发明公开
CN115599925A 一种信息提取方法及装置
审中-实审
- 专利标题: 一种信息提取方法及装置
-
申请号: CN202211337105.7申请日: 2022-10-28
-
公开(公告)号: CN115599925A公开(公告)日: 2023-01-13
- 发明人: 徐耀彬 , 刘伟棠 , 陈立力 , 周明伟
- 申请人: 浙江大华技术股份有限公司(CN)
- 申请人地址: 浙江省杭州市滨江区滨安路1187号
- 专利权人: 浙江大华技术股份有限公司(CN)
- 当前专利权人: 浙江大华技术股份有限公司(CN)
- 当前专利权人地址: 浙江省杭州市滨江区滨安路1187号
- 代理机构: 北京同达信恒知识产权代理有限公司
- 代理商 潘平
- 主分类号: G06F16/36
- IPC分类号: G06F16/36 ; G06F16/35 ; G06F40/284 ; G06F40/295 ; G06F18/241 ; G06F18/25 ; G06N3/047 ; G06N3/048 ; G06N3/0499 ; G06N3/08
摘要:
本申请实施例提供一种信息提取方法及装置,应用在人工智能技术领域,包括:获取待识别文本,并构建待识别文本的词向量序列;将词向量序列输入到关系分类层,获得待识别文本中包含的目标关系类型;针对每种目标关系类型,基于目标关系类型对应的类型特征向量和词向量序列,确定在目标关系类型下待识别文本包含的至少一个实体;基于目标关系类型和至少一个实体,构建目标关系类型对应的三元组信息。通过关系分类层提取待识别文本中包含的至少一种目标关系类型,确定在目标关系类型下待识别文本包含实体,解决句子结构不完整的情况下无法构建关系模型输入的问题,也避免实体抽取模型产生的误差会传递给关系抽取模型,从而提高信息抽取准确性。