-
公开(公告)号:CN117313861A
公开(公告)日:2023-12-29
申请号:CN202311278351.4
申请日:2023-09-28
申请人: 清华大学 , 科大讯飞股份有限公司
摘要: 本申请公开了一种模型预训练数据获取方法、模型预训练方法、装置及设备,本申请针对半结构化和/或结构化的预训练语料文本,按照其所属语料类型预先配置了对应的数据推理逻辑,为了提升模型的学习能力,本申请按照语料类型对应的数据推理逻辑,从预训练语料中抽取逻辑链条的起因和结果,由起因和结果组成上下文推理数据,进而用于作为医疗大语言模型预训练时的训练数据。显然,采用本申请得到的上下文推理数据,在训练医疗大语言模型时,可以使得模型学习到逻辑链条中从起因到结果的推理逻辑,也即学习到语料内部医学知识间的推理逻辑,能够提升医疗大语言模型的能力。
-
公开(公告)号:CN110277165B
公开(公告)日:2021-06-04
申请号:CN201910567661.5
申请日:2019-06-27
申请人: 清华大学 , 科大讯飞股份有限公司
摘要: 本申请提出一种基于图神经网络的辅助诊断方法、装置、设备及存储介质,其中,该方法包括:从病例文档中提取得到病例关键词;至少根据提取得到的各个病例关键词以及所述病例文档,构建拓扑结构图,所述拓扑结构图用于表示病例关键词之间,以及病例文档和病例关键词之间的关联关系;利用预先训练的图神经网络对所述拓扑结构图进行处理,确定与所述病例文档对应的疾病诊断结果;其中,所述图神经网络至少通过对拓扑结构图进行处理确定疾病诊断结果训练得到。该方法以病例文档为基础,借助图神经网络对患者疾病进行诊断,实现了自动化的辅助诊断,将该方案应用于临床可以显著减轻医生工作量,提高疾病诊断效率。
-
公开(公告)号:CN111370102A
公开(公告)日:2020-07-03
申请号:CN202010081698.X
申请日:2020-02-06
申请人: 清华大学 , 科大讯飞股份有限公司
IPC分类号: G16H40/20 , G06F40/295 , G06F16/35 , G06N3/04
摘要: 本发明公开了一种科室导诊方法、装置以及设备。设计基础是1)使病患自主自助进行科室导诊查询,无需配置大量的医护人力。2)在自主自助查询时需对两个维度问题一并克服,从病患角度,需要去除专业医学信息的困扰;从自助系统角度,需要提升对非专业病患输入的模糊查询信息的辨识和分析能力。因而,本发明提供的主要方案是先对输入的问诊文本进行初步科室识别和文本有效性判断,将可以直接进行科室推荐或非法问诊输入先行处理,进而采用文本分类以及关键信息检索的双策略联合方式,对无法直接推荐科室的有效的病情描述进行深入分析,从而给出准确、可靠的推荐就诊科室,引导患者顺利就医,进而缓解医院导诊咨询的压力。
-
公开(公告)号:CN111310463A
公开(公告)日:2020-06-19
申请号:CN202010084814.3
申请日:2020-02-10
申请人: 清华大学 , 科大讯飞股份有限公司
IPC分类号: G06F40/289 , G06F40/30 , G06N3/04 , G06N3/08
摘要: 本发明实施例提供一种试题难度预估方法、装置、电子设备和存储介质,其中方法包括:确定试题文本的试题特征,试题特征包括记忆力特征和/或逻辑推理特征;其中,记忆力特征表征试题文本与教学文本之间的相关性,逻辑推理特征表征试题文本中各关键词之间的关联性;将试题特征输入至试题难度预估模型,得到试题难度预估模型输出的难度预估结果;其中,试题难度预估模型是基于样本试题文本的样本试题特征以及样本难度预估结果训练得到的。本发明实施例提供的方法、装置、电子设备和存储介质,通过模拟考生的解题过程,使得试题难度预估能够贴合考生的解题思维,反映真实的试题难度,提高试题难度预估的可靠性和准确性。
-
公开(公告)号:CN103440270B
公开(公告)日:2017-06-09
申请号:CN201310334235.X
申请日:2013-08-02
申请人: 清华大学 , 科大讯飞股份有限公司
IPC分类号: G06F17/30
摘要: 本发明涉及音频处理技术领域,公开了一种实现音频文件重复模式发现的系统和方法。该系统包括:获取模块,用于获取各音频文件;特征提取模块,用于从所述音频文件中提取音频比对特征;匹配模块,用于基于所述音频比对特征依次两两匹配所述音频文件,得到两两匹配的重复音频片段;合并模块,用于将在多个音频文件中均出现的重复音频片段进行合并,生成音频文件重复模式。利用本发明,可以实现大规模音频库中重复模式的准确发现。
-
公开(公告)号:CN103440234B
公开(公告)日:2017-03-01
申请号:CN201310316262.4
申请日:2013-07-25
申请人: 清华大学 , 科大讯飞股份有限公司
IPC分类号: G06F17/27
摘要: 本发明涉及自然语言处理技术领域,公开了一种自然语言理解系统及方法。该系统包括:网络库构建模块,用于预先建立有向图文法网络库,所述有向图文法网络库中存储根据句文法规则生成的有向图文法网络;接收模块,用于接收用户输入的自然语言;文本内容获取模块,用于获取所述自然语言对应的文本内容;匹配模块,用于将所述文本内容与所述有向图文法网络进行匹配,得到匹配路径;语义确定模块,用于获取并输出所述匹配路径上的语义信息。本发明可以满足用户针对海量文本数据的深层语义理解的需求。
-
公开(公告)号:CN106156238A
公开(公告)日:2016-11-23
申请号:CN201510205659.5
申请日:2015-04-27
申请人: 科大讯飞股份有限公司 , 清华大学
IPC分类号: G06F17/30
摘要: 本发明公开了一种本体信息查询方法及系统,该方法包括:接收查询请求;根据所述查询请求构建查询树;采用正序和倒序相结合的方式遍历所述查询树的每个叶子节点,得到所述叶子节点中未知变量取值集合;如果所述未知变量在所述未知变量取值集合中都有对应的取值,则将所述未知变量取值集合作为查询结果。利用本发明,可以提高信息查询效率,降低对内存的消耗。
-
公开(公告)号:CN111310463B
公开(公告)日:2022-08-05
申请号:CN202010084814.3
申请日:2020-02-10
申请人: 清华大学 , 科大讯飞股份有限公司
IPC分类号: G06F40/289 , G06F40/30 , G06N3/04 , G06N3/08
摘要: 本发明实施例提供一种试题难度预估方法、装置、电子设备和存储介质,其中方法包括:确定试题文本的试题特征,试题特征包括记忆力特征和/或逻辑推理特征;其中,记忆力特征表征试题文本与教学文本之间的相关性,逻辑推理特征表征试题文本中各关键词之间的关联性;将试题特征输入至试题难度预估模型,得到试题难度预估模型输出的难度预估结果;其中,试题难度预估模型是基于样本试题文本的样本试题特征以及样本难度预估结果训练得到的。本发明实施例提供的方法、装置、电子设备和存储介质,通过模拟考生的解题过程,使得试题难度预估能够贴合考生的解题思维,反映真实的试题难度,提高试题难度预估的可靠性和准确性。
-
公开(公告)号:CN110136788B
公开(公告)日:2021-08-17
申请号:CN201910397723.2
申请日:2019-05-14
申请人: 清华大学 , 科大讯飞股份有限公司
IPC分类号: G16H10/60 , G06F40/289 , G06K9/62 , G06N3/04 , G06N3/08
摘要: 本申请提供了一种基于自动检测的病历质检方法、装置、设备及存储介质,其中,方法包括:获取待质检病历,其中,待质检病历包括多项信息;若多项信息中有至少一项必要信息缺失,则确定待质检病历为不合格的病历,其中,必要信息为按病历的书写要求必须书写的信息;若多项信息中的必要信息未缺失,则基于多项信息中的至少部分信息的内容确定待质检病历是否为合格的病历,其中,多项信息中的至少部分信息包括必要信息中的至少部分信息。本申请提供的基于自动检测的病历质检方法可自动、及时、高效地对病历的质量进行检测,进而能及时规范医生的诊疗行为。
-
公开(公告)号:CN111261286A
公开(公告)日:2020-06-09
申请号:CN202010096164.4
申请日:2020-02-17
申请人: 清华大学 , 科大讯飞股份有限公司
摘要: 本申请提供了一种辅助诊断模型构建方法、诊断方法、装置、设备及介质,其中,辅助诊断模型构建方法包括:获取训练病历集;通过辅助诊断模型,预测训练病历集中病历的诊断结果,并评估病历的质量得分;以预测的病历的诊断结果及其质量得分为依据,更新辅助诊断模型的参数,以得到构建的辅助诊断模型。采用本申请提供的辅助诊断模型能够针对待测病例给出正确的诊断结果。
-
-
-
-
-
-
-
-
-