发明公开
- 专利标题: 一种基于深度学习算法的审计知识图谱实体抽取方法
-
申请号: CN202111682324.4申请日: 2021-12-29
-
公开(公告)号: CN114417835A公开(公告)日: 2022-04-29
- 发明人: 贾晓亮 , 孙常鹏 , 戴斐斐 , 李博 , 刘德玉 , 张耀心 , 赵猛 , 高静
- 申请人: 国网天津市电力公司 , 国家电网有限公司 , 国网天津市电力公司信息通信公司
- 申请人地址: 天津市河北区五经路39号; ;
- 专利权人: 国网天津市电力公司,国家电网有限公司,国网天津市电力公司信息通信公司
- 当前专利权人: 国网天津市电力公司,国家电网有限公司,国网天津市电力公司信息通信公司
- 当前专利权人地址: 天津市河北区五经路39号; ;
- 代理机构: 天津盛理知识产权代理有限公司
- 代理商 王雨晴
- 主分类号: G06F40/242
- IPC分类号: G06F40/242 ; G06F40/295 ; G06F40/30 ; G06F16/36 ; G06N3/04
摘要:
本发明涉及一种基于深度学习算法的审计知识图谱实体抽取方法,包括以下步骤:步骤1、输入审计记录中审查过程描述文本序列;步骤2、基于步骤1输入审计记录中审查过程描述文本序列,生成融合审计词典知识的编码器,计算编码器输出特征向量;步骤3、利用单层LSTM网络对编码器输出的文本特征向量进行解码,得到包含实体潜藏关系的细粒度问题线索三元组序列。本发明针对审计过程详细情节,采用融合领域词典知识基于深度学习的问题线索三元组抽取细粒度实体关系联合抽取,更好利用了实体模型与关系模型交互与约束,实现结构化提取和存储审计事项,提升了对非结构化长文本实体关系抽取模型的性能。