-
公开(公告)号:CN111368528A
公开(公告)日:2020-07-03
申请号:CN202010156316.5
申请日:2020-03-09
申请人: 西南交通大学
IPC分类号: G06F40/279 , G06F16/35 , G06K9/62 , G06N3/04 , G06N3/08
摘要: 本发明公开了一种面向医学文本的实体关系联合抽取方法,该方法包括对医学文本实体关系数据集按照三元组方式进行重组,将医学文本语句向量化表示,采用双向长短期记忆网络加自注意力机制构建参数共享层,采用softmax函数预测头实体标签,采用CNN-softmax进行关系-尾实体联合解码,结合头实体预测结果增强联合解码表示,采用联合损失函数优化方式训练参数共享层和联合解码层。本发明解决了医学文本中实体和关系类别和位置分布不均匀、多对关系同时出现在同一句的问题,能够提高医学文本实体关系抽取的质量和效率。
-
公开(公告)号:CN111368528B
公开(公告)日:2022-07-08
申请号:CN202010156316.5
申请日:2020-03-09
申请人: 西南交通大学
IPC分类号: G06F40/279 , G06F16/35 , G06K9/62 , G06N3/04 , G06N3/08
摘要: 本发明公开了一种面向医学文本的实体关系联合抽取方法,该方法包括对医学文本实体关系数据集按照三元组方式进行重组,将医学文本语句向量化表示,采用双向长短期记忆网络加自注意力机制构建参数共享层,采用softmax函数预测头实体标签,采用CNN‑softmax进行关系‑尾实体联合解码,结合头实体预测结果增强联合解码表示,采用联合损失函数优化方式训练参数共享层和联合解码层。本发明解决了医学文本中实体和关系类别和位置分布不均匀、多对关系同时出现在同一句的问题,能够提高医学文本实体关系抽取的质量和效率。
-