-
公开(公告)号:CN111581364A
公开(公告)日:2020-08-25
申请号:CN202010370543.8
申请日:2020-05-06
申请人: 厦门理工学院
IPC分类号: G06F16/332 , G06F16/36 , G06F40/216 , G06F40/295 , G06F40/30 , G06N3/04 , G06N3/08
摘要: 本发明提供了一种面向医疗领域的中文智能问答短文本相似度计算方法,涉及自然语言处理与智能问答领域。该方法针对中文医疗领域,采用SH-CNN对用户输入的问句与智能问答系统中预设定的问题模板进行向量化,然后提取出两文本中的突出特征进行相似度计算,再结合TF-IDF的加权处理以获取更具可信性的文本相似度结果。根据结果获得用户输入问句的问题类型,结合使用词性标注方法获取的问句中的医疗实体,构造面向知识图谱的查询语句,并从中检索答案返回给用户。基于该方法所构造的智能问答系统能够快速的为用户提供简洁准确的答案,具有较高的实用价值。
-
公开(公告)号:CN112487202B
公开(公告)日:2022-05-06
申请号:CN202011356803.2
申请日:2020-11-27
申请人: 厦门理工学院
IPC分类号: G06F16/36 , G06F40/211 , G06F40/295
摘要: 本发明公开一种融合知识图谱与BERT的中文医学命名实体识别方法及装置,方法包括:构建知识图谱的数据模型;在医疗网站上爬取疾病简介页面中的相应内容,将所述内容存储在数据库中,并将所述数据库中的数据导出为json文件;根据所述数据模型从所述json文件抽取医学实体和实体关系,构建医疗知识图谱K;识别输入的句子中包含的医学实体,并根据医疗知识图谱将医学实体填充成三元组ε=(wi,rk,wj);将三元组注入到句子中,生成句子树;通过嵌入层中的软位置索引和可视层中的可视矩阵对所述句子树进行处理,以解决引入外部知识可能产生的知识噪音问题和BERT模型无法处理图结构句子树的问题。本发明可快速、有效的提取出文本中包含的医学实体,具有较高的准确性。
-
公开(公告)号:CN111581364B
公开(公告)日:2022-05-03
申请号:CN202010370543.8
申请日:2020-05-06
申请人: 厦门理工学院
IPC分类号: G06F16/332 , G06F16/36 , G06F40/216 , G06F40/295 , G06F40/30 , G06N3/04 , G06N3/08
摘要: 本发明提供了一种面向医疗领域的中文智能问答短文本相似度计算方法,涉及自然语言处理与智能问答领域。该方法针对中文医疗领域,采用SH‑CNN对用户输入的问句与智能问答系统中预设定的问题模板进行向量化,然后提取出两文本中的突出特征进行相似度计算,再结合TF‑IDF的加权处理以获取更具可信性的文本相似度结果。根据结果获得用户输入问句的问题类型,结合使用词性标注方法获取的问句中的医疗实体,构造面向知识图谱的查询语句,并从中检索答案返回给用户。基于该方法所构造的智能问答系统能够快速的为用户提供简洁准确的答案,具有较高的实用价值。
-
公开(公告)号:CN112487202A
公开(公告)日:2021-03-12
申请号:CN202011356803.2
申请日:2020-11-27
申请人: 厦门理工学院
IPC分类号: G06F16/36 , G06F40/211 , G06F40/295
摘要: 本发明公开一种融合知识图谱与BERT的中文医学命名实体识别方法及装置,方法包括:构建知识图谱的数据模型;在医疗网站上爬取疾病简介页面中的相应内容,将所述内容存储在数据库中,并将所述数据库中的数据导出为json文件;根据所述数据模型从所述json文件抽取医学实体和实体关系,构建医疗知识图谱K;识别输入的句子中包含的医学实体,并根据医疗知识图谱将医学实体填充成三元组ε=(wi,rk,wj);将三元组注入到句子中,生成句子树;通过嵌入层中的软位置索引和可视层中的可视矩阵对所述句子树进行处理,以解决引入外部知识可能产生的知识噪音问题和BERT模型无法处理图结构句子树的问题。本发明可快速、有效的提取出文本中包含的医学实体,具有较高的准确性。
-
-
-