-
公开(公告)号:CN110110324B
公开(公告)日:2022-12-02
申请号:CN201910297065.X
申请日:2019-04-15
Applicant: 大连理工大学
Abstract: 本发明提供一种基于知识表示的生物医学实体链接方法,属于自然语言处理领域。本发明包括三个步骤:文本预处理、基于生物医学知识库的实体表示学习、基于知识表示的生物医学实体链接。本发明将生物医学知识库中实体间的同一实体多种变体和不同实体同名的结构信息作为向量空间上的约束,采用自动编码机,通过最小化重构误差学习实体标识符ID的向量表示,将生物医学知识库中的实体结构信息转化为知识表示。同时,本发明基于知识表示构建了一个生物医学实体链接模型,融合文本语义表示和实体ID表示实现对实体提及的消歧,提升生物医学实体链接的准确性和可靠性。
-
公开(公告)号:CN106598952A
公开(公告)日:2017-04-26
申请号:CN201611209507.3
申请日:2016-12-23
Applicant: 大连理工大学
IPC: G06F17/27
Abstract: 本发明公开了一种基于卷积神经网络的中文模糊限制信息范围检测方法,包括如下步骤:对待处理语料中包含模糊限制语的句子进行分词;进行句法解析,得到语料中语句对应的短语结构树;基于短语的候选样例筛选策略,获得候选短语;抽取左、右边界词和模糊限制语的上下文信息;将左边界候选词上下文信息和模糊限制语上下文信息组合成为左边界候选样例词序列,将右边界候选词上下文信息和模糊限制语上下文信息组合成为右边界候选样例词序列;将所述的左、右边界候选样例词序列,映射到实数向量空间,分别表示成左、右边界的词向量序列,得到左边界F‑scope检测模型和右边界L‑scope检测模型,得到分类器;将左、右边界分类器的结果合并成句子级别的结果,得到最终的范围检测结果。
-
公开(公告)号:CN110110324A
公开(公告)日:2019-08-09
申请号:CN201910297065.X
申请日:2019-04-15
Applicant: 大连理工大学
Abstract: 本发明提供一种基于知识表示的生物医学实体链接方法,属于自然语言处理领域。本发明包括三个步骤:文本预处理、基于生物医学知识库的实体表示学习、基于知识表示的生物医学实体链接。本发明将生物医学知识库中实体间的同一实体多种变体和不同实体同名的结构信息作为向量空间上的约束,采用自动编码机,通过最小化重构误差学习实体标识符ID的向量表示,将生物医学知识库中的实体结构信息转化为知识表示。同时,本发明基于知识表示构建了一个生物医学实体链接模型,融合文本语义表示和实体ID表示实现对实体提及的消歧,提升生物医学实体链接的准确性和可靠性。
-
公开(公告)号:CN106611055A
公开(公告)日:2017-05-03
申请号:CN201611222553.7
申请日:2016-12-27
Applicant: 大连理工大学
Abstract: 本发明公开了一种基于层叠式神经网络的中文模糊限制信息范围检测方法,其特征在于包括如下步骤:对待分析实验语料中含有模糊限制语的句子,进行分词处理;使用句法解析器对分词处理后的句子进行句法解析,得到所述句子的短语结构树;通过基于短语的候选样例筛选策略找到候选短语,进而确定候选短语的边界词,包括左边界词和右边界词;使用抽取窗口分别抽取所述的左、右边界词和模糊限制语的上下文信息;将左、右边界词和模糊限制语的上下文信息作为候选样例词序列并映射到实数向量空间,转换为词向量形式;输入基于长短时记忆网络LSTM和卷积神经网络CNN相结合的层叠式学习模型LSTM‑CNN进行学习,得到边界分类器;对测试数据进行分类,得到左、右边界的分类结果。
-
-
-