发明授权
- 专利标题: 一种句子级实体和关系联合抽取方法
-
申请号: CN201910549585.5申请日: 2019-06-24
-
公开(公告)号: CN110377903B公开(公告)日: 2020-08-14
- 发明人: 张寅 , 王岩
- 申请人: 浙江大学
- 申请人地址: 浙江省杭州市西湖区余杭塘路866号
- 专利权人: 浙江大学
- 当前专利权人: 浙江大学
- 当前专利权人地址: 浙江省杭州市西湖区余杭塘路866号
- 代理机构: 杭州求是专利事务所有限公司
- 代理商 傅朝栋; 张法高
- 主分类号: G06F40/295
- IPC分类号: G06F40/295 ; G06N3/04
摘要:
本发明公开了一种基于神经网络的实体和关系的联合抽取技术。该技术包含如下步骤:1)将句子作为输入,获取每个单词的表示向量,该表示向量由词嵌入表示和字符级别词嵌入表示拼接而成;2)使用膨胀卷积神经网络对每个单词的上下文信息进行编码,为每个单词提取包含上下文信息的特征;3)把实体识别作为序列标注问题,并使用线性链CRF来对实体标记序列联合建模;预测时,使用维特比算法计算概率最大的实体标记序列,实现实体识别;4)从组成实体的单词的特征表示中来获得实体的特征表示,通过对实体两两排列来构造关系候选,使用双仿射变换判断每个关系候选的关系,实现关系抽取。
公开/授权文献
- CN110377903A 一种句子级实体和关系联合抽取方法 公开/授权日:2019-10-25