增强语义表示的层次BiLSTM中文电子病历疾病编码标注方法

    公开(公告)号:CN109697285A

    公开(公告)日:2019-04-30

    申请号:CN201811523661.7

    申请日:2018-12-13

    Applicant: 中南大学

    Inventor: 王建新 余颖 李敏

    Abstract: 本发明公开了一种增强语义表示的层次BiLSTM中文电子病历疾病编码标注方法,对输入的电子病历文本进行预处理后,考虑中文词语构成中,单个汉字包含具体语义,利用引入关注机制的BiLSTM提取字符级特征向量表示,获得单个汉字的语义及构词特征;将字符级词向量表示与利用word2vec训练得到的词语级别的向量表示进行拼接,得到字符特征增强的词语向量表示;以特征词向量表示的文本序列作为输入,再次利用BiLSTM学习整个电子病历中的上下文特征,并采用关注机制,计算各个特征词的贡献度,得到上下文特征加权的文本向量表示,提高了预测效果。本发明的方法适用于基于中文电子病历文本的疾病标签分类任务,并有效提高了分类效果。

    增强语义表示的层次BiLSTM中文电子病历疾病编码标注方法

    公开(公告)号:CN109697285B

    公开(公告)日:2022-06-21

    申请号:CN201811523661.7

    申请日:2018-12-13

    Applicant: 中南大学

    Inventor: 王建新 余颖 李敏

    Abstract: 本发明公开了一种增强语义表示的层次BiLSTM中文电子病历疾病编码标注方法,对输入的电子病历文本进行预处理后,考虑中文词语构成中,单个汉字包含具体语义,利用引入关注机制的BiLSTM提取字符级特征向量表示,获得单个汉字的语义及构词特征;将字符级词向量表示与利用word2vec训练得到的词语级别的向量表示进行拼接,得到字符特征增强的词语向量表示;以特征词向量表示的文本序列作为输入,再次利用BiLSTM学习整个电子病历中的上下文特征,并采用关注机制,计算各个特征词的贡献度,得到上下文特征加权的文本向量表示,提高了预测效果。本发明的方法适用于基于中文电子病历文本的疾病标签分类任务,并有效提高了分类效果。

Patent Agency Ranking