基于DBSCAN聚类的不平衡停电数据集混合采样方法

    公开(公告)号:CN115600108A

    公开(公告)日:2023-01-13

    申请号:CN202211307896.9

    申请日:2022-10-25

    Abstract: 本发明公开了一种基于DBSCAN聚类的不平衡停电数据集混合采样方法,包括以下步骤:S1.对不平衡停电数据集进行DBSCAN聚类,通过DBSCAN聚类将不平衡停电数据集划分为多个不同的簇;S2.遍历每一个簇并计算簇中样本的不平衡比,不平衡比等于零的簇进行随机采样生成子数据集,不平衡比大于零的簇进行邻域清理规则欠采样和SMOTE过采样生成子数据集;S3.将经过采样处理后生成的各子数据集合并,生成新的平衡停电数据集。本发明通过DBSCAN聚类将不平衡停电数据集划分为多个不同的簇,遍历每个簇并计算簇中样本的不平衡比,根据不平衡比确定是对簇进行随机采样还是进行邻域清理规则欠采样和SMOTE过采样而生成子数据集,能够在降低数据不平衡程度的同时,尽可能地避免有效信息的丢失。

Patent Agency Ranking