-
公开(公告)号:CN118014076B
公开(公告)日:2024-07-09
申请号:CN202410419286.0
申请日:2024-04-09
申请人: 中国人民解放军总医院
IPC分类号: G06N5/025 , G06N3/0455
摘要: 本发明公开了一种知识抽取方法,具体是涉及到一种医学知识抽取方法、装置、电子设备及可读存储介质。所述方法包括:对待处理文本进行文本表征,得到多个候选实体表征,以及基于医学知识库中与所述待处理文本相关的内容获取高阶图表征;将所述高阶图表征与所述多个候选实体表征融合,得到目标实体表征;基于所述目标实体表征进行三元组抽取,得到目标三元组。本发明实施例提供的医学知识抽取方法可以提高对医学知识进行抽取的效果。
-
公开(公告)号:CN118262925A
公开(公告)日:2024-06-28
申请号:CN202410361932.2
申请日:2024-03-27
申请人: 中国人民解放军总医院 , 北京嘉和美康信息技术有限公司
摘要: 本申请提供了一种研究人群集合构建方法、装置、设备以及存储介质,涉及医疗技术领域。在执行该方法时,先确定研究人群的纳排标准,再获取临床病历数据,接着,将临床病历数据进行处理,再按照病历文书类型对处理后的临床病历数据进行整合索引,得到研究人群构建数据集,根据纳排标准和处理后的临床病历数据,确定纳排条件,并根据纳排条件对研究人群构建数据集进行纳排,以构建研究人群结果集,并对其进行干预剔除,得到研究人群集合。这样,通过对处理后的临床病例历数据进行整合索引,可以有效的减少纳排条件的条目数,进而提高研究人群集合构建的效率。
-
公开(公告)号:CN118014076A
公开(公告)日:2024-05-10
申请号:CN202410419286.0
申请日:2024-04-09
申请人: 中国人民解放军总医院
IPC分类号: G06N5/025 , G06N3/0455
摘要: 本发明公开了一种知识抽取方法,具体是涉及到一种医学知识抽取方法、装置、电子设备及可读存储介质。所述方法包括:对待处理文本进行文本表征,得到多个候选实体表征,以及基于医学知识库中与所述待处理文本相关的内容获取高阶图表征;将所述高阶图表征与所述多个候选实体表征融合,得到目标实体表征;基于所述目标实体表征进行三元组抽取,得到目标三元组。本发明实施例提供的医学知识抽取方法可以提高对医学知识进行抽取的效果。
-
公开(公告)号:CN116306925B
公开(公告)日:2024-05-03
申请号:CN202310262378.8
申请日:2023-03-14
申请人: 中国人民解放军总医院
IPC分类号: G06N5/02 , G06N5/025 , G06F40/295 , G06F16/36 , G16H50/70
摘要: 本发明公开了一种生成端到端实体链接方法和系统,包括:基于待链接实体的类型、属性、关系、名称,构建待链接实体序列;待链接实体为第一知识图谱中的实体;将待链接实体序列作为输入序列输入到训练好的seq2seq模型中进行指称识别和实体消歧,得到多个推荐实体名称;多个推荐实体名称为第二知识图谱中的实体名称;基于n‑gram相似度和分词召回率计算每个推荐实体名称的评分;基于每个推荐实体名称的评分,确定待链接实体在第二知识图谱中所对应的目标链接实体。本发明缓解了现有模型中两阶段任务带来的误差损失。
-
公开(公告)号:CN117727412A
公开(公告)日:2024-03-19
申请号:CN202311774452.0
申请日:2023-12-21
申请人: 中国人民解放军总医院 , 北京嘉和美康信息技术有限公司
IPC分类号: G16H10/60 , G06F16/31 , G06F16/84 , G06F40/216 , G06F40/284 , G06F18/22 , G06F18/25 , G06N3/0442 , G06N3/045 , G06N3/047
摘要: 本发明提供了一种电子病历的噪声过滤方法、系统、电子设备及存储介质,该方法包括:对待处理电子病历进行分词处理以得到多个待处理文本元素,待处理文本元素为字或词;确定待处理文本元素的多个指定特征值,以及确定待处理文本元素的多个普通特征值;将待处理文本元素的文本元素向量、多个指定特征值、多个普通特征值进行融合以得到相应的融合特征;将各个待处理文本元素对应的融合特征输入预设的噪声识别模型进行处理,以预测出待处理文本元素的标签;过滤待处理电子病历中标签为噪声标签的待处理文本元素。本发明基于融合特征和噪声识别模型预测出噪声标签的待处理文本元素进行过滤,有效提高噪声过滤效果和降低噪声误判率。
-
公开(公告)号:CN117149868A
公开(公告)日:2023-12-01
申请号:CN202311003008.9
申请日:2023-08-10
申请人: 中国人民解放军总医院
摘要: 本发明公开了一种跨院区数据的分布处理方法,涉及医疗大数据处理关键技术领域,方法包括:对原始多源数据集进行异构性识别,建立结构化处理模板和非结构化处理模板;基于结构化处理模板和非结构化处理模板对各个院区的原始多源数据集进行模板化处理,得到处理后的模板多源数据集;根据云端服务器对各个存储单元中的模板多源数据集进行调用集成,搭建多源共享数据平台;基于多源共享数据平台,建立数据知识图谱,当多源共享数据平台接收到任一跨院区用户的数据请求信息,对数据知识图谱进行遍历,输出被调数据集,解决了现有技术中存在的医疗大数据处理工作由于不够完善而导致多源异构医疗数据无法融合汇聚的问题,实现了关于知识图谱的合理构建。
-
公开(公告)号:CN115618947A
公开(公告)日:2023-01-17
申请号:CN202211545351.1
申请日:2022-12-05
申请人: 中国人民解放军总医院
IPC分类号: G06N5/02 , G06F18/2433 , G06Q10/0639 , G06F16/901 , G06Q50/00 , G06Q50/22
摘要: 本公开是关于一种医疗知识图谱质量评估系统、装置、设备、介质及产品,包括:获取基于schema搭建的医疗知识图谱;对所述医疗知识图谱执行预检查操作,所述预检查操作至少包括定义字段数据类型检查、离群点检查、知识图谱拓扑结构检查中的一种;基于社交网络的社区发现及修正的互信息量做为评价指标对所述医疗知识图谱进行检查,获取所述医疗知识图谱评估结果。本申请通过预检查和社交网络中社区发现的基本算法,发现不同本体中存在的社区,利用修正的互信息衡量知识图谱中关系质量。
-
公开(公告)号:CN118352068A
公开(公告)日:2024-07-16
申请号:CN202410494847.3
申请日:2024-04-24
申请人: 中国人民解放军总医院
摘要: 本发明公开了一种基于MRL向量构建患者呼吸衰竭早期预警模型的方法及系统,收集医院收治患者完整临床病历数据,并分为普通病房数据集和重症监护室数据集,对数据集进行数据预处理,采用MRL嵌入向量表示文本特征,采用集成学习算法构建普通病房呼吸衰竭风险预测模型;采用时序网络模型构建重症监护室呼吸衰竭预测模型;分别对两类模型进行模型评估,得到对应的最佳呼吸衰竭预测模型;将所得呼吸衰竭预测模型与临床辅助系统集成后,并实时提示普通病房和重症监护室中患者的呼吸衰竭预测风险。系统包括中设有输入模块、筛选模块、数据预处理模块、模型评估模块、模型构建模块及呼吸预测模块,本发明充分考虑了普通病房和监护室患者,使模型更具广泛适用性,能更精准的预测和干预。
-
公开(公告)号:CN116364296A
公开(公告)日:2023-06-30
申请号:CN202310179714.2
申请日:2023-02-17
申请人: 中国人民解放军总医院
IPC分类号: G16H50/70
摘要: 本公开是关于一种标准检查项目名称确认方法、装置、设备、介质及产品,包括:将待标准化的检查项目名称数据输入到预训练的多分类模型中,获取预测标准检查项目名称的概率值,检查项目名称数据包括检查类型、检查项目名称、检查参数、检查所见描述数据、检查结论描述数据;当概率值低于预设阈值时,将待标准化的检查项目名称数据输入到预训练的多维度规则匹配模型中,获取预测标准检查项目名称候选集;基于预测标准检查项目名称候选集,获取待标准化的检查项目名称数据的标准检查项目名称,本申请通过多分类模型进行标准检查项目名称预测,对于不符合阈值,利用多维度的规则模型加权预测,获取标准检查项目名称。
-
公开(公告)号:CN116306925A
公开(公告)日:2023-06-23
申请号:CN202310262378.8
申请日:2023-03-14
申请人: 中国人民解放军总医院
IPC分类号: G06N5/02 , G06N5/025 , G06F40/295 , G06F16/36 , G16H50/70
摘要: 本发明公开了一种生成端到端实体链接方法和系统,包括:基于待链接实体的类型、属性、关系、名称,构建待链接实体序列;待链接实体为第一知识图谱中的实体;将待链接实体序列作为输入序列输入到训练好的seq2seq模型中进行指称识别和实体消歧,得到多个推荐实体名称;多个推荐实体名称为第二知识图谱中的实体名称;基于n‑gram相似度和分词召回率计算每个推荐实体名称的评分;基于每个推荐实体名称的评分,确定待链接实体在第二知识图谱中所对应的目标链接实体。本发明缓解了现有模型中两阶段任务带来的误差损失。
-
-
-
-
-
-
-
-
-