-
公开(公告)号:CN110516239A
公开(公告)日:2019-11-29
申请号:CN201910788092.7
申请日:2019-08-26
Applicant: 贵州大学
Abstract: 本发明公开了一种基于卷积神经网络的分段池化关系抽取方法,所述方法包括如下步骤:步骤一:基于预训练词向量和随机词向量以及零向量对文本进行向量映射;步骤二:通过神经网络对向量矩阵进行卷积操作提取特征;步骤3:对卷积后的结果分段池化进一步抽象特征;步骤4:全连接、Softmax层预测结果。在充分利用句子文本完整信息的基础上,采用实体分割策略,引入神经网络技术,充分发挥神经网络分层自动提取高维抽象特征的特点,将提取由实体分割的文本各部分池化特征,并且在一定程度上避免传统机器学习方法产生的特征稀疏问题,从而提高关系抽取的性能。
-
公开(公告)号:CN118917301B
公开(公告)日:2024-12-10
申请号:CN202411411874.6
申请日:2024-10-11
Applicant: 贵州大学
IPC: G06F40/205 , G06F40/30 , G06N3/0464 , G06N3/042 , G06N3/08 , G06F16/35
Abstract: 本发明涉及语言结构学习技术领域,特别是一种面向实体关系抽取的语言结构学习方法及系统,从数据集中提取关系提及语句、实体对以及实体对间的语义关系类别;将实体特征序列与实体标记语句结合得到文本序列,输入神经网络模型;将所述文本序列中的词映射成向量,得到抽象表示矩阵;构建增强特征关联邻接矩阵,作为神经网络模型训练的可变参数;抽象表示矩阵与增强特征关联邻接矩阵进行图卷积操作,并进行残差链接,得到文本语言结构特征;对文本语言结构特征进行全连接操作,通过激活函数和线性分类,输出语义关系分类结果。通过构建特征关联邻接矩阵,在神经网络隐藏层中不断更新矩阵,达到学习语言结构关系的目的,改善实体关系抽取的性能。
-
公开(公告)号:CN111126039B
公开(公告)日:2022-04-01
申请号:CN201911355241.7
申请日:2019-12-25
Applicant: 贵州大学
IPC: G06F40/211 , G06F40/295 , G06F40/30 , G06F16/33 , G06N3/04 , G06N3/08
Abstract: 本发明公开了一种面向关系抽取的句子结构信息获取方法,所述方法包括如下步骤:步骤一、从数据集中抽取包含两个实体且已知实体语义关系类别的关系提及语句;步骤二、使用实体标记符和分隔符将步骤一中抽取出来的关系提及语句中的实体进行分隔和标记;步骤三、基于预训练字向量查找表或随机字向量查找表对文本进行向量映射;步骤四、通过神经网络对表示文本的向量矩阵进行卷积操作提取句子结构特征;步骤五、对卷积后的结果实施最大池化操作,进一步获取抽象特征;步骤六、全连接、Softmax层预测分类结果。通过在卷积神经网络之前对句子实体进行标记和分隔,能够更好地得到各部分内容的语义信息,获取到以实体为中心的句子结构特征,进行关系抽取,可以达到一个比较好的性能。
-
公开(公告)号:CN110516239B
公开(公告)日:2022-12-09
申请号:CN201910788092.7
申请日:2019-08-26
Applicant: 贵州大学
IPC: G06F16/36 , G06F40/279 , G06F40/30 , G06N3/04
Abstract: 本发明公开了一种基于卷积神经网络的分段池化关系抽取方法,所述方法包括如下步骤:步骤一:基于预训练词向量和随机词向量以及零向量对文本进行向量映射;步骤二:通过神经网络对向量矩阵进行卷积操作提取特征;步骤3:对卷积后的结果分段池化进一步抽象特征;步骤4:全连接、Softmax层预测结果。在充分利用句子文本完整信息的基础上,采用实体分割策略,引入神经网络技术,充分发挥神经网络分层自动提取高维抽象特征的特点,将提取由实体分割的文本各部分池化特征,并且在一定程度上避免传统机器学习方法产生的特征稀疏问题,从而提高关系抽取的性能。
-
公开(公告)号:CN110377912A
公开(公告)日:2019-10-25
申请号:CN201910669518.7
申请日:2019-07-24
Applicant: 贵州大学
Abstract: 本发明公开了一种基于多通道深度神经网络的关系识别方法,该方法可以有效获取句子的结构信息和语义信息。在关系识别任务中,能否有效获取句子的结构信息对最终识别效果有至关重要的作用。目前获取句子结构信息的方法主要是位置向量和解析树。本发明提出了一种新的获取句子结构信息的思路,即利用句子本身的特点,将句中两实体将句子切分成不同的部分,每部分作为一个通道单独进行词嵌入,经过深度神经网络进行特征提取,进行关系识别。使用真实数据证明该方法能显著提高关系识别效果。
-
公开(公告)号:CN118917301A
公开(公告)日:2024-11-08
申请号:CN202411411874.6
申请日:2024-10-11
Applicant: 贵州大学
IPC: G06F40/205 , G06F40/30 , G06N3/0464 , G06N3/042 , G06N3/08 , G06F16/35
Abstract: 本发明涉及语言结构学习技术领域,特别是一种面向实体关系抽取的语言结构学习方法及系统,从数据集中提取关系提及语句、实体对以及实体对间的语义关系类别;将实体特征序列与实体标记语句结合得到文本序列,输入神经网络模型;将所述文本序列中的词映射成向量,得到抽象表示矩阵;构建增强特征关联邻接矩阵,作为神经网络模型训练的可变参数;抽象表示矩阵与增强特征关联邻接矩阵进行图卷积操作,并进行残差链接,得到文本语言结构特征;对文本语言结构特征进行全连接操作,通过激活函数和线性分类,输出语义关系分类结果。通过构建特征关联邻接矩阵,在神经网络隐藏层中不断更新矩阵,达到学习语言结构关系的目的,改善实体关系抽取的性能。
-
公开(公告)号:CN111126039A
公开(公告)日:2020-05-08
申请号:CN201911355241.7
申请日:2019-12-25
Applicant: 贵州大学
IPC: G06F40/211 , G06F40/295 , G06F40/30 , G06F16/33 , G06N3/04 , G06N3/08
Abstract: 本发明公开了一种面向关系抽取的句子结构信息获取方法,所述方法包括如下步骤:步骤一、从数据集中抽取包含两个实体且已知实体语义关系类别的关系提及语句;步骤二、使用实体标记符和分隔符将步骤一中抽取出来的关系提及语句中的实体进行分隔和标记;步骤三、基于预训练字向量查找表或随机字向量查找表对文本进行向量映射;步骤四、通过神经网络对表示文本的向量矩阵进行卷积操作提取句子结构特征;步骤五、对卷积后的结果实施最大池化操作,进一步获取抽象特征;步骤六、全连接、Softmax层预测分类结果。通过在卷积神经网络之前对句子实体进行标记和分隔,能够更好地得到各部分内容的语义信息,获取到以实体为中心的句子结构特征,进行关系抽取,可以达到一个比较好的性能。
-
-
-
-
-
-