-
公开(公告)号:CN109697285A
公开(公告)日:2019-04-30
申请号:CN201811523661.7
申请日:2018-12-13
Applicant: 中南大学
Abstract: 本发明公开了一种增强语义表示的层次BiLSTM中文电子病历疾病编码标注方法,对输入的电子病历文本进行预处理后,考虑中文词语构成中,单个汉字包含具体语义,利用引入关注机制的BiLSTM提取字符级特征向量表示,获得单个汉字的语义及构词特征;将字符级词向量表示与利用word2vec训练得到的词语级别的向量表示进行拼接,得到字符特征增强的词语向量表示;以特征词向量表示的文本序列作为输入,再次利用BiLSTM学习整个电子病历中的上下文特征,并采用关注机制,计算各个特征词的贡献度,得到上下文特征加权的文本向量表示,提高了预测效果。本发明的方法适用于基于中文电子病历文本的疾病标签分类任务,并有效提高了分类效果。
-
公开(公告)号:CN109697285B
公开(公告)日:2022-06-21
申请号:CN201811523661.7
申请日:2018-12-13
Applicant: 中南大学
IPC: G06F40/289 , G06F40/30 , G16H10/60 , G06N3/04 , G06N3/08
Abstract: 本发明公开了一种增强语义表示的层次BiLSTM中文电子病历疾病编码标注方法,对输入的电子病历文本进行预处理后,考虑中文词语构成中,单个汉字包含具体语义,利用引入关注机制的BiLSTM提取字符级特征向量表示,获得单个汉字的语义及构词特征;将字符级词向量表示与利用word2vec训练得到的词语级别的向量表示进行拼接,得到字符特征增强的词语向量表示;以特征词向量表示的文本序列作为输入,再次利用BiLSTM学习整个电子病历中的上下文特征,并采用关注机制,计算各个特征词的贡献度,得到上下文特征加权的文本向量表示,提高了预测效果。本发明的方法适用于基于中文电子病历文本的疾病标签分类任务,并有效提高了分类效果。
-