一种病种库建立系统及方法

    公开(公告)号:CN110415791A

    公开(公告)日:2019-11-05

    申请号:CN201910089992.2

    申请日:2019-01-29

    IPC分类号: G16H30/20 G06F16/50 G06N3/04

    摘要: 本发明公开一种病种库建立系统及方法,包括:数据挖掘模块,用于从预定的医疗子系统中搜集目标病种的临床医疗信息;临床医疗信息包括临床文本信息和/或临床影像信息;文本转化模块,用于将数据挖掘模块搜集到的临床文本信息转化为预定结构的文本信息,获取规范化文本数据;文本转化模块包括训练后的长短记忆型递归神经网络;影像信息提取模块,用于提取临床影像信息中的预定信息,获取结构化影像数据;影像信息提取模块包括训练后的卷积神经网络;数据库,用于获取并存储规范化文本数据和结构化影像数据。本发明提供的技术方案,能够自动建立起全周期、多维度数据的病种库,从而大大扩展了现有病种库的数据完整性和科研可用性。

    一种确定肺癌临床病种库文本实体的方法及装置

    公开(公告)号:CN111145914B

    公开(公告)日:2023-08-04

    申请号:CN201911399541.5

    申请日:2019-12-30

    摘要: 本申请实施例提供一种确定肺癌临床病种库文本实体的方法及装置,方法包括:获取待识别肺癌临床病种库文本数据,并确定所述待识别肺癌临床病种库文本数据中各字段的词向量;对各词向量进行编码处理,得到各词向量的编码向量;根据各编码向量之间的相关性,确定任一编码向量的解码结果,所述解码结果为所述待识别肺癌临床病种库文本数据中的字段;根据各编码向量的解码结果得到所述待识别肺癌临床病种库文本数据中的文本实体。本申请实施例引入了自注意力机制,能够解决文本字段之间的长距离依赖关系,准确全面的确定待识别文本数据的向量特征,以便准确确定待识别文本数据中的实体。

    一种确定肺癌临床病种库文本实体的方法及装置

    公开(公告)号:CN111145914A

    公开(公告)日:2020-05-12

    申请号:CN201911399541.5

    申请日:2019-12-30

    摘要: 本申请实施例提供一种确定肺癌临床病种库文本实体的方法及装置,方法包括:获取待识别肺癌临床病种库文本数据,并确定所述待识别肺癌临床病种库文本数据中各字段的词向量;对各词向量进行编码处理,得到各词向量的编码向量;根据各编码向量之间的相关性,确定任一编码向量的解码结果,所述解码结果为所述待识别肺癌临床病种库文本数据中的字段;根据各编码向量的解码结果得到所述待识别肺癌临床病种库文本数据中的文本实体。本申请实施例引入了自注意力机制,能够解决文本字段之间的长距离依赖关系,准确全面的确定待识别文本数据的向量特征,以便准确确定待识别文本数据中的实体。