-
公开(公告)号:CN112667799A
公开(公告)日:2021-04-16
申请号:CN202110273760.X
申请日:2021-03-15
申请人: 四川大学
IPC分类号: G06F16/332 , G06F16/33 , G06F16/36 , G06F16/9535 , G06F40/126 , G06F40/216 , G06F40/295 , G06N3/04 , G16H70/00
摘要: 本发明公开了一种基于语言模型和实体匹配的医疗问答系统构建方法,包括S1.数据收集,S2.深度神经网络模型设计,S3.训练命名实体识别模型并构建知识图谱,S4.构建完整的医疗检索式问答系统。收集网络医疗讨论帖清洗后存入到ElasticSearch中,用于作为检索数据集;使用医疗自然语言处理比赛数据集的开源数据,训练出医疗相关的命名实体识别模型;收集开源网站的公开数据集构成医疗知识图谱,来扩充检索流程。本发明基于语言模型和实体匹配的医疗问答系统方法,构建问答系统在经过召回、精排和综合评分几个步骤之后,结合合理的评分机制,输出一个最为合适的回答,弥补检索式问答系统和知识图谱式问答系统的缺陷。
-
公开(公告)号:CN112667799B
公开(公告)日:2021-06-01
申请号:CN202110273760.X
申请日:2021-03-15
申请人: 四川大学
IPC分类号: G06F16/332 , G06F16/33 , G06F16/36 , G06F16/9535 , G06F40/126 , G06F40/216 , G06F40/295 , G06N3/04 , G16H70/00
摘要: 本发明公开了一种基于语言模型和实体匹配的医疗问答系统构建方法,包括S1.数据收集,S2.深度神经网络模型设计,S3.训练命名实体识别模型并构建知识图谱,S4.构建完整的医疗检索式问答系统。收集网络医疗讨论帖清洗后存入到ElasticSearch中,用于作为检索数据集;使用医疗自然语言处理比赛数据集的开源数据,训练出医疗相关的命名实体识别模型;收集开源网站的公开数据集构成医疗知识图谱,来扩充检索流程。本发明基于语言模型和实体匹配的医疗问答系统方法,构建问答系统在经过召回、精排和综合评分几个步骤之后,结合合理的评分机制,输出一个最为合适的回答,弥补检索式问答系统和知识图谱式问答系统的缺陷。
-