-
公开(公告)号:CN111261286B
公开(公告)日:2024-05-31
申请号:CN202010096164.4
申请日:2020-02-17
申请人: 清华大学 , 科大讯飞股份有限公司
摘要: 本申请提供了一种辅助诊断模型构建方法、诊断方法、装置、设备及介质,其中,辅助诊断模型构建方法包括:获取训练病历集;通过辅助诊断模型,预测训练病历集中病历的诊断结果,并评估病历的质量得分;以预测的病历的诊断结果及其质量得分为依据,更新辅助诊断模型的参数,以得到构建的辅助诊断模型。采用本申请提供的辅助诊断模型能够针对待测病例给出正确的诊断结果。
-
公开(公告)号:CN111145906A
公开(公告)日:2020-05-12
申请号:CN201911418266.7
申请日:2019-12-31
申请人: 清华大学 , 科大讯飞股份有限公司
IPC分类号: G16H50/20 , G06F40/289 , G06N3/04 , G06N3/08
摘要: 本申请公开了一种项目判定方法,首先获取待判定项目的项目关联文本,然后确定项目关联文本中的主干信息,以及,每个主干信息的修饰信息;基于主干信息,以及,每个主干信息的修饰信息,确定项目关联文本的图结构;最后,对项目关联文本的图结构进行分析,确定待判定项目的判定结果。本申请中采用分析项目关联文本的图结构实现项目判定的方式,相对于人工判定的方式,可以节省人力和时间,进而可以降低成本,提高项目判定效率。基于上述方式,能够实现诸如医疗领域的辅助诊断预测项目,以及司法领域的辅助查证取值预测项目等项目的判定。
-
公开(公告)号:CN117313861A
公开(公告)日:2023-12-29
申请号:CN202311278351.4
申请日:2023-09-28
申请人: 清华大学 , 科大讯飞股份有限公司
摘要: 本申请公开了一种模型预训练数据获取方法、模型预训练方法、装置及设备,本申请针对半结构化和/或结构化的预训练语料文本,按照其所属语料类型预先配置了对应的数据推理逻辑,为了提升模型的学习能力,本申请按照语料类型对应的数据推理逻辑,从预训练语料中抽取逻辑链条的起因和结果,由起因和结果组成上下文推理数据,进而用于作为医疗大语言模型预训练时的训练数据。显然,采用本申请得到的上下文推理数据,在训练医疗大语言模型时,可以使得模型学习到逻辑链条中从起因到结果的推理逻辑,也即学习到语料内部医学知识间的推理逻辑,能够提升医疗大语言模型的能力。
-
公开(公告)号:CN110277165B
公开(公告)日:2021-06-04
申请号:CN201910567661.5
申请日:2019-06-27
申请人: 清华大学 , 科大讯飞股份有限公司
摘要: 本申请提出一种基于图神经网络的辅助诊断方法、装置、设备及存储介质,其中,该方法包括:从病例文档中提取得到病例关键词;至少根据提取得到的各个病例关键词以及所述病例文档,构建拓扑结构图,所述拓扑结构图用于表示病例关键词之间,以及病例文档和病例关键词之间的关联关系;利用预先训练的图神经网络对所述拓扑结构图进行处理,确定与所述病例文档对应的疾病诊断结果;其中,所述图神经网络至少通过对拓扑结构图进行处理确定疾病诊断结果训练得到。该方法以病例文档为基础,借助图神经网络对患者疾病进行诊断,实现了自动化的辅助诊断,将该方案应用于临床可以显著减轻医生工作量,提高疾病诊断效率。
-
公开(公告)号:CN111402979B
公开(公告)日:2024-05-31
申请号:CN202010213728.8
申请日:2020-03-24
申请人: 清华大学 , 科大讯飞股份有限公司
IPC分类号: G16H10/60 , G06F16/35 , G06N3/045 , G06N3/0442 , G06N3/0464
摘要: 本发明实施例提供一种病情描述与诊断一致性检测方法及装置,其中方法包括:确定待检测的病历中的病情描述文本和诊断结果;将病情描述文本和诊断结果输入至一致性检测模型,得到一致性检测模型输出的病历的一致性检测结果;其中,一致性检测模型是基于样本病历中的样本病情描述文本、样本诊断结果,以及样本病历的样本一致性检测结果训练得到的;一致性检测模型用于基于病情描述文本的病情描述编码,以及诊断结果的诊断疾病编码,多维度分析病情描述编码和诊断疾病编码的相关性,进行一致性检测。本发明实施例提供的方法及装置,提高了一致性检测方法的普适性及准确性。
-
公开(公告)号:CN111145906B
公开(公告)日:2024-04-30
申请号:CN201911418266.7
申请日:2019-12-31
申请人: 清华大学 , 科大讯飞股份有限公司
IPC分类号: G16H50/20 , G06F40/289 , G06N3/042 , G06N3/0464
摘要: 本申请公开了一种项目判定方法,首先获取待判定项目的项目关联文本,然后确定项目关联文本中的主干信息,以及,每个主干信息的修饰信息;基于主干信息,以及,每个主干信息的修饰信息,确定项目关联文本的图结构;最后,对项目关联文本的图结构进行分析,确定待判定项目的判定结果。本申请中采用分析项目关联文本的图结构实现项目判定的方式,相对于人工判定的方式,可以节省人力和时间,进而可以降低成本,提高项目判定效率。基于上述方式,能够实现诸如医疗领域的辅助诊断预测项目,以及司法领域的辅助查证取值预测项目等项目的判定。
-
公开(公告)号:CN117217233A
公开(公告)日:2023-12-12
申请号:CN202311266352.7
申请日:2023-09-27
申请人: 清华大学 , 科大讯飞股份有限公司
IPC分类号: G06F40/30 , G06F40/289 , G06F18/22 , G06N3/045 , G06N3/0442
摘要: 本发明提供一种文本纠正、文本纠正模型训练方法及装置,所述方法包括:确定待纠正的答案文本以及答案文本对应的提问文本,以及与提问文本关联的知识文本;将答案文本、提问文本以及知识文本输入至文本纠正模型,得到文本纠正模型输出的答案文本的文本纠正结果;文本纠正模型以最小化预测错误实体与错误实体标签之间的差异,以及最小化文本纠正预测结果与文本纠正标签之间的差异为目标训练。本发明提供的种文本纠正、文本纠正模型训练方法及装置,文本纠正模型是联合错误实体识别任务与文本纠正任务进行训练的,从而错误实体识别任务与文本纠正任务之间能够相互提供辅助增强信息,进一步提高文本纠正模型的文本纠正精度。
-
公开(公告)号:CN117216570A
公开(公告)日:2023-12-12
申请号:CN202311266309.0
申请日:2023-09-27
申请人: 清华大学 , 科大讯飞股份有限公司
IPC分类号: G06F18/214 , G06F18/22 , G06F16/332 , G06N5/022
摘要: 本发明提供一种领域模型训练、指令执行方法、一体机和存储介质,其中训练方法包括:获取目标领域的任务指令;基于完成任务指令所需的知识信息,生成知识问答对;基于完成任务指令所需执行的步骤,生成步骤问答对;基于知识问答对和/或步骤问答对,生成所述任务指令的执行过程,将所述任务指令和所述执行过程作为任务问答对;基于所述任务问答对,训练所述目标领域的领域模型。本发明提供的方法、一体机和存储介质,使得模型能够学习到如何在任务指令执行中应用目标领域下的知识、如何通过推理逻辑解决复杂问题,实现了对于多粒度、多难度的目标领域下任务指令的知识分解和任务步骤分解,由此提高领域模型的训练效果,更好地适应目标领域。
-
公开(公告)号:CN111402979A
公开(公告)日:2020-07-10
申请号:CN202010213728.8
申请日:2020-03-24
申请人: 清华大学 , 科大讯飞股份有限公司
摘要: 本发明实施例提供一种病情描述与诊断一致性检测方法及装置,其中方法包括:确定待检测的病历中的病情描述文本和诊断结果;将病情描述文本和诊断结果输入至一致性检测模型,得到一致性检测模型输出的病历的一致性检测结果;其中,一致性检测模型是基于样本病历中的样本病情描述文本、样本诊断结果,以及样本病历的样本一致性检测结果训练得到的;一致性检测模型用于基于病情描述文本的病情描述编码,以及诊断结果的诊断疾病编码,多维度分析病情描述编码和诊断疾病编码的相关性,进行一致性检测。本发明实施例提供的方法及装置,提高了一致性检测方法的普适性及准确性。
-
公开(公告)号:CN110277165A
公开(公告)日:2019-09-24
申请号:CN201910567661.5
申请日:2019-06-27
申请人: 清华大学 , 科大讯飞股份有限公司
摘要: 本申请提出一种基于图神经网络的辅助诊断方法、装置、设备及存储介质,其中,该方法包括:从病例文档中提取得到病例关键词;至少根据提取得到的各个病例关键词以及所述病例文档,构建拓扑结构图,所述拓扑结构图用于表示病例关键词之间,以及病例文档和病例关键词之间的关联关系;利用预先训练的图神经网络对所述拓扑结构图进行处理,确定与所述病例文档对应的疾病诊断结果;其中,所述图神经网络至少通过对拓扑结构图进行处理确定疾病诊断结果训练得到。该方法以病例文档为基础,借助图神经网络对患者疾病进行诊断,实现了自动化的辅助诊断,将该方案应用于临床可以显著减轻医生工作量,提高疾病诊断效率。
-
-
-
-
-
-
-
-
-