不平衡数据的分类方法、装置、存储介质及设备

    公开(公告)号:CN112579711B

    公开(公告)日:2024-09-24

    申请号:CN202011584448.4

    申请日:2020-12-28

    Abstract: 本发明涉及机器学习技术领域,公开了一种不平衡数据的分类方法、装置、存储介质及设备,所述方法包括:获取不平衡数据集,通过SVM算法计算不平衡数据集的支持向量集合,计算多数类集合中的每一个样本到支持向量集合中的每一个支持向量的第一距离,根据第一距离计算样本位置统计量,根据样本位置统计量计算类位统计量,根据类位统计量类位统计量对多数类集合进行下采样,获得下采样后的多数类集合。本发明提供的一种不平衡数据的分类方法、装置、存储介质及设备,利用数据样本与支持向量的距离度量数据样本的局部密度信息,从分布上考虑数据的不平衡程度,提高不平衡数据分类的准确率。

Patent Agency Ranking