一种不平衡医疗数据集的处理方法及装置

    公开(公告)号:CN118535980A

    公开(公告)日:2024-08-23

    申请号:CN202410613582.4

    申请日:2024-05-17

    Abstract: 本发明涉及医疗数据处理领域,特别涉及一种不平衡医疗数据集的处理方法及装置;所述方法包括获取医疗数据集,所述医疗数据集包括多个医疗样本数据,包括少数类医疗样本或者多数类医疗样本;将所述少数类医疗样本输入到自动编码器,输出所述少数类医疗样本对应的低维向量;将每个少数类医疗样本对应的低维向量进行层次聚类,获得所述少数类医疗样本的路径信息;将所述少数类医疗样本的路径信息作为条件变量输入条件生成对抗网络中,输出生成的少数类医疗样本;将生成的少数类医疗样本加入到医疗数据集中,获得优化后的医疗数据集。本发明解决了不平衡医疗数据的类间不平衡和类内不平衡,显著提高了医疗预测模型的全面性和准确性。

Patent Agency Ranking