跨语言的医学知识图谱构建方法、装置与电子设备

    公开(公告)号:CN110990579B

    公开(公告)日:2022-12-02

    申请号:CN201911044916.6

    申请日:2019-10-30

    IPC分类号: G06F16/36 G16H50/70

    摘要: 本发明实施例提供一种跨语言的医学知识图谱构建方法、装置与电子设备,其中所述方法包括:基于不同语言的医疗标准,通过将生成的跨语言且异构的数据集中的概念与关系进行融合,获取跨语言的概念知识图谱;通过对来自医院、开放数据集和社交数据集中所述不同语言的电子病历进行实体、事件和关系的抽取与融合,获取跨语言的实例知识图谱;将所述跨语言的概念知识图谱与所述跨语言的实例知识图谱相结合,形成跨语言的事实知识图谱。本发明实施例通过对多种不同语言的医疗标准和实例电子病历分别进行分析与信息提取,能够更加准确地对知识库中不同语言形成的知识图谱进行融合,从而得到更加准确、可靠的医学知识图谱。

    基于知识蒸馏的知识图谱对齐方法、装置及设备

    公开(公告)号:CN114328952A

    公开(公告)日:2022-04-12

    申请号:CN202111562165.4

    申请日:2021-12-17

    申请人: 清华大学

    摘要: 本发明提供一种基于知识蒸馏的知识图谱对齐方法、装置及设备,方法通过获取待对齐知识图谱集合,所述待对齐知识图谱集合包括至少两个不同的待对齐知识图谱,每个所述待对齐知识图谱中包括至少一个实体;输入所述待对齐知识图谱集合至知识图谱对齐模型,将不同的所述待对齐知识图谱中的相同实体进行对齐;其中,所述知识图谱对齐模型是基于知识图谱样本和预先确定的所述知识图谱样本中的实体标签进行训练后得到的,通过基于知识图谱对齐模型来进行实体对齐,与单纯的学习知识嵌入或邻域共识相比,在对齐过程中,知识图谱对齐模型由于结合具体的实体,能够更好地利用到关系语义信息,从而更好地实现实体对齐。

    一种数据预存取方法及装置
    3.
    发明公开

    公开(公告)号:CN115098408A

    公开(公告)日:2022-09-23

    申请号:CN202210658236.9

    申请日:2022-06-10

    申请人: 清华大学

    摘要: 本发明提供一种数据预存取方法及装置。其中,所述方法包括以下步骤:获取待预测数据页,提取所述待预测数据页的数据特征;将所述待预测数据页的数据特征输入预先训练的预测模型中,得到数据相关值和目标数据页;确认所述数据相关值大于预设阈值,则将所述目标数据页进行预存取;其中,所述预先训练的预测模型是根据历史调用数据页样本训练得到的。本发明使用机器学习模型来获取数据页访问的模式,从而大大提高了数据页预存取的准确性,对数据库系统和大数据系统等领域的发展具有重要意义。

    基于多任务学习和图注意力网络的ICD编码方法及装置

    公开(公告)号:CN113988013A

    公开(公告)日:2022-01-28

    申请号:CN202111243214.8

    申请日:2021-10-25

    申请人: 清华大学

    摘要: 本发明提供一种基于多任务学习和图注意力网络的ICD编码方法及装置,方法包括:获取至少一个编码预测任务对应的医疗文本;至少一个编码预测任务包括ICD编码任务;根据至少一个编码预测任务对应的医疗文本,构建相应的文本图;将文本图输入编码预测模型,得到编码预测结果;编码预测结果包括ICD编码结果,编码预测模型基于训练数据对图注意力网络进行训练得到。本发明提供的基于多任务学习和图注意力网络的ICD编码方法及装置,由于在编码预测前先将医疗文本转化为文本图的形式,可以缓解数据不平衡的问题,有效提高了医疗文本的自动编码效果,编码结果更加准确、可靠。

    基于医生协助的医疗领域知识图谱构建方法

    公开(公告)号:CN110968650A

    公开(公告)日:2020-04-07

    申请号:CN201911046361.9

    申请日:2019-10-30

    申请人: 清华大学

    摘要: 本发明提供一种基于医生协助的医疗领域知识图谱构建方法,方法包括:获取医生输入的文本,并从预先构建的医学词库和概念知识图谱中分别查找与文本相似的多个概念;获取医生根据医学词库和概念知识图谱的查找结果从医学词库的查找结果中选择的概念,将医生选择的概念添加到概念知识图谱中;将电子病历中的结构数据进行模型转换,电子病历的非结构数据中提取实体和关系,根据模型转换后的结构数据、实体和关系构建实例知识图谱;将概念知识图谱和实例知识图谱结合为事实知识图谱。本发明将医生的先验知识和自动构建知识图谱方法结合起来,自动方法帮助医生节省时间和精力,医生的先验知识弥补自动方法的不足,使得构建的图谱更加符合实际应用需求。

    针对特定医疗领域的知识图谱构建方法及装置

    公开(公告)号:CN110929040A

    公开(公告)日:2020-03-27

    申请号:CN201911046367.6

    申请日:2019-10-30

    申请人: 清华大学

    摘要: 本发明提供一种针对特定医疗领域的知识图谱构建方法及装置,方法包括:根据医学词库中的医学标准和目标医疗领域的医生的先验知识,构建目标医疗领域的概念知识图谱;根据目标医疗领域的电子病历,构建所述目标医疗领域的实例知识图谱;将所述概念知识图谱和所述实例知识图谱结合为事实知识图谱。本发明使用医生的先验知识对特定医疗领域的概念和关系进行辨识,使得构建的知识图谱更符合实际需求;同时,本实施例可以构建各种不同医疗领域的知识图谱,而且基于构建好的特定医疗领域的知识图谱,根据医生的先验知识和实际需求可以向其他疾病领域扩展。

    一种支持蓝牙连接的计步器装置

    公开(公告)号:CN103791915A

    公开(公告)日:2014-05-14

    申请号:CN201410049219.0

    申请日:2014-02-12

    申请人: 清华大学

    IPC分类号: G01C22/00

    CPC分类号: G01C22/006

    摘要: 本发明提供一种支持蓝牙连接的计步器装置,包括采样模块、蓝牙模块、显示模块和主控模块;采样模块,通过I2C接口与主控模块连接,用于按照预设的采样频率对运动状态进行采样;蓝牙模块,通过USART接口与主控模块连接,用于与支持蓝牙功能的设备进行数据传输;显示模块,通过SPI接口与主控模块连接,用于显示当前计步数据、时间和电量信息;主控模块,用于对采样数据进行处理,将处理后的计步数据通过显示模块进行显示并通过蓝牙模块与支持蓝牙功能的设备进行数据传输。本发明提供的一种支持蓝牙连接的计步器装置,提高了计步器的精确度、延长使用寿命,通过蓝牙模块同步手机应用简化了计步器的设置同时方便了计步数据的管理与维护。

    基于因果干预和反事实推理的自然语言理解模型去偏方法

    公开(公告)号:CN113988290A

    公开(公告)日:2022-01-28

    申请号:CN202111241439.X

    申请日:2021-10-25

    申请人: 清华大学

    摘要: 本发明提供一种基于因果干预和反事实推理的自然语言理解模型去偏方法,包括根据输入数据集构建因果图,并确定输入数据集的总效应,因果图包括前提、假设和组合特征;分别对前提、假设和组合特征进行建模,得到前提模型、假设模型和组合特征模型;通过融合函数,将前提模型、假设模型和组合特征模型进行融合,得到融合模型;利用do演算去除融合模型中的混杂因素,得到初步自然语言理解模型;利用反事实推理去除初步自然语言理解模型中假设模型的自然直接影响,基于总效应和自然直接影响得到推理结果作为目标自然语言理解模型,通过因果干预和反事实推理的处理过程,可以有效地提高目标自然语言理解模型的精准度。

    面向链接预测的交互式多模态融合方法及装置

    公开(公告)号:CN114297402A

    公开(公告)日:2022-04-08

    申请号:CN202111553153.5

    申请日:2021-12-17

    申请人: 清华大学

    摘要: 本发明提供一种面向链接预测的交互式多模态融合方法及装置,方法通过获取待预测知识图谱,包括结构化模态、可视化模态和文本模态;分别提取结构化模态、可视化模态和文本模态的高层次特征信息,得到结构化模态嵌入表示、可视化模态嵌入表示和文本模态嵌入表示;对结构化模态嵌入表示、可视化模态嵌入表示和文本模态嵌入表示进行聚合,通过双线性矩阵计算得到多模态嵌入表示;分别通过各个不同的表示预测目标实体,得到结构化预测结果、可视化预测结果、文本预测结果和多模态预测结果;调整各个预测结果的权重,得到目标预测结果,通过多模态融合能够有效地保留各模态中的专有知识实现互补性链接预测,极大地提高链接预测的准确度。