一种基于采样算法优化与无监督聚类的软件缺陷预测方法

    公开(公告)号:CN116628526A

    公开(公告)日:2023-08-22

    申请号:CN202310740101.1

    申请日:2023-06-21

    摘要: 本发明涉及一种基于采样算法优化与无监督聚类的软件缺陷预测方法,包括1)数据集过采样:根据原始数据集类别比例信息和设定的平衡系数,计算少数类样本需要生成的数据量并生成,得到平衡数据集;2)数据集标准化:对平衡数据集进行标准化处理,得到标准数据集;3)无监督聚类:构建聚类模型,将标准数据集输入到聚类模型中进行聚类操作,把标准数据集划分成2类;4)聚类结果确认:对聚类分成的2类进行确认类别处理,判断数据所代表的软件有无缺陷;5)预测评价指标:构建模型评价指标,获取模型评价指标信息,衡量软件缺陷预测的准确度。本发明方法流程设计合理,使用方便,与传统的算法相比,具有采样效果更好,聚类结果更准确的优势。