一种基于图神经网络的医疗ICD编码分类方法

    公开(公告)号:CN119474981A

    公开(公告)日:2025-02-18

    申请号:CN202411589268.3

    申请日:2024-11-08

    Abstract: 本发明属于医疗ICD自动编码领域,具体涉及一种基于图神经网络的医疗ICD编码分类方法,包括获取数据集并进行预处理得到文本向量矩阵;根据文本向量矩阵构建图结构,所述图结构包括节点特征矩阵和邻接矩阵;将图结构输入图神经网络模型输出预测ICD编码结果,采用基于交叉熵的多标签损失函数对模型进行训练;将待编码的病历数据输入训练好的图神经网络模型,得到预测ICD编码;本发明将医疗术语间的语义相似度、ICD编码间的层次距离和共现频率关系纳入图结构中,能够全面地捕捉词语及标签之间的复杂关系,更好地利用了ICD编码间的潜在关联性,增强了分类模型的上下文理解能力和准确性。

    一种基于多粒度与对比学习的异构表格数据分类方法

    公开(公告)号:CN119004209A

    公开(公告)日:2024-11-22

    申请号:CN202411099686.4

    申请日:2024-08-12

    Abstract: 本发明涉及一种基于多粒度与对比学习的异构表格数据分类方法,包括:获取待检测的异构表格数据,将其依次输入训练后的编码器网络和分类器网络,输出特定标签的分类结果;其网络训练过程包括:获取第一训练样本集,对提取样本中各列数据的特征,经过特征分解与合并得到全局特征集;将全局特征集随机划分特征子集,在特征子集下对样本进行聚类,根据聚类结果构建正负样本对;利用该正负样本对迭代优化编码器网络;获取与待检测的异构表格数据相关的且带有特定标签的第二训练样本,对其编码后输入分类器网络,迭代优化分类器网络。本发明可以提高异构表格数据的分类预测准确性,本发明中的编码器网络和分类器网络具有更优的鲁棒性和泛化能力。

Patent Agency Ranking