医学预测模型的不平衡数据处理方法、装置及设备

    公开(公告)号:CN116978571A

    公开(公告)日:2023-10-31

    申请号:CN202311095976.7

    申请日:2023-08-28

    IPC分类号: G16H50/50 G06F18/22 G06F18/23

    摘要: 本发明公开了一种医学预测模型的不平衡数据处理方法、装置及设备,涉及医学数据处理领域,包括获取少数类样本;根据所述少数类样本之间的相似性,将所述少数类样本划分为多个样本簇;根据所述样本簇的聚类中心,确定所述样本簇的表面点,其中,所述表面点为所述样本簇中与聚类中心距离值最小的样本;根据所述样本簇的聚类中心和表面点的距离值,确定样本生成区域;基于预设生成量,根据所述样本生成区域内的的少数类样本,生成处理样本。本发明解决了罕见疾病的样本数量较少,导致疾病预测模型对于罕见疾病的准确性低的技术问题,进而实现了在疾病预测模型对于罕见疾病的预测准确性的提升。