一种基于多模态融合的心血管疾病风险预测方法
Abstract:
本发明公开了一种基于多模态融合的心血管疾病风险预测方法。获取医疗数据集中的病患体征数据;对病人在医院期间产生的各类文本报告进行聚合;将获取的病患体征数据使用图神经网络GNN‑encoder作为时序主干的网络,进行时序特征的提取;将聚合的各类文本报告中病患文本报告使用基于预训练的分层BioBERT模型作为语言主干网络,进行文本特征的提取;将时序特征和文本特征拼接在一起,通过一个自注意力深度融合网络,得到融合后的特征作为病患身体状况在特征空间上的嵌入向量;构造一个基于多层感知机的二元分类器,得到是否患有心血管疾病的二分类结果;构造一个基于多层感知机的多元分类器,得到预测的病人所患亚型。本发明用以解决医学文本数据集存在的文本报告过长,难以在不损失全文信息的同时有效提取语义特征的问题。
Public/Granted literature
Patent Agency Ranking
0/0