一种电力数据预测训练样本优化方法及系统
摘要:
本发明提供一种电力数据预测训练样本优化方法包括:采集获取电力结构化信息,根据所述电力结构化信息处理得架空线样本数据;处理所述架空线样本数据,以得到正常数据集和异常数据集;处理所述正常数据集和所述异常数据集,以获取异常样本簇和正常样本簇;谱聚类处理所述异常样本簇和所述正常样本簇,以得到负谱类聚中心数据和正谱类聚中心数据;邻采样处理所述正谱类聚中心数据,以降低所述正常样本簇的规模;插值处理所述负谱类聚中心数据,以扩充较少样本规模。本发明通过离线的谱聚类算法与数据增强算法,平衡训练数据的正负样本分布,使得随机森林和神经网络训练性能得到极大提升。
0/0