- 专利标题: 一种金融文本关系抽取方法、系统及存储介质
-
申请号: CN202410417863.2申请日: 2024-04-09
-
公开(公告)号: CN118012992B公开(公告)日: 2024-07-02
- 发明人: 方宇鹏 , 吴庆耀
- 申请人: 华南理工大学
- 申请人地址: 广东省广州市天河区五山路381号
- 专利权人: 华南理工大学
- 当前专利权人: 华南理工大学
- 当前专利权人地址: 广东省广州市天河区五山路381号
- 代理机构: 广州嘉权专利商标事务所有限公司
- 代理商 郑宏谋
- 主分类号: G06F16/33
- IPC分类号: G06F16/33 ; G06F40/295 ; G06N3/042 ; G06N3/0464 ; G06N3/08 ; G06N5/02
摘要:
本发明公开了一种金融文本关系抽取方法、系统及存储介质,属于自然语言处理技术领域。方法包括:预处理金融文本数据,将文本拆解为句子级的输入序列,并加上实体标记;将输入序列的各词语转换为嵌入向量,并获取各词语的上下文序列信息,得到输入序列的表征;根据输入序列的表征提取词语之间的依存关系,得到句法增强表征;根据句法增强表征分别提取金融实体的类型信息和上下文信息;引入金融实体外部知识库,并提取金融实体的知识增强表征;预测实体之间的关系类别,作为金融文本关系抽取的结果。本发明通过基于依存句法树的注意力机制捕获文本的句法增强特征,并通过注意力机制和外部知识图卷积增强金融实体信息,提高金融文本的关系抽取性能。
公开/授权文献
- CN118012992A 一种金融文本关系抽取方法、系统及存储介质 公开/授权日:2024-05-10