-
公开(公告)号:CN112069633B
公开(公告)日:2023-04-07
申请号:CN202010798057.6
申请日:2020-08-10
Applicant: 国网上海市电力公司
IPC: G06F30/18 , G06F30/25 , G06F16/906 , G06Q10/04 , G06Q50/06 , H02J3/00 , G06F113/04 , G06F119/02
Abstract: 一种采用大数据聚类的基于粒子群原理的配电网数据预处理方法,属配电网可靠性预测领域。对经归一化处理后的配电网数据,采用以弯矩法为主、凹凸系数法为辅的聚类数选取机制,来获得样本最佳的聚类数;在对样本进行聚类分析后,采用上下临界图的异常值识别标准划定诊断阈值;若样本距离聚类中心的距离大于诊断阈值,则判别该样本为离群样本,并剔除;进而得到“除噪”的样本数据;采用经过上述“除噪”处理后的样本数据,对配电网故障潜在规则进行预测。既克服了弯矩法和凹凸系数算法容易陷入局部极值的缺点,又保持了粒子群算法的全局寻优性,同时还具有弯矩法和凹凸系数算法较快的收敛速度;具有除噪效果好,分选正确率和有效性高的优点。
-
公开(公告)号:CN112085619A
公开(公告)日:2020-12-15
申请号:CN202010797427.4
申请日:2020-08-10
Applicant: 国网上海市电力公司
IPC: G06Q50/06 , G06F16/215 , G06F16/2458 , G06K9/62
Abstract: 一种用于配电网数据优化的特征选择方法,属电力数据分析处理领域。根据相关数据源,量化配电网故障某类影响因素后使其成为故障特征变量;数据矩阵根据每个故障表达的平均值进行预处理和离散化;输出特征数量n由用户从外部提供,然后输入类别数据矩阵;对目标值A,按每个故障的相关性通过互信息最大化计算;然后对剩余的输出特征进行循环反复更新;将目标值B模型函数设定为特征相关性指标和冗余度指标之比,并使其最大化;依次循环分拣出得分最高的特征向量,直到筛选出的特征集范围延伸至事先确定的界限值,则输出最优特征子集,否则重复以上步骤。该技术方案能够有效地降低特征选择方法的复杂度,从而提高配电网故障数据分类准确性。
-
公开(公告)号:CN112069633A
公开(公告)日:2020-12-11
申请号:CN202010798057.6
申请日:2020-08-10
Applicant: 国网上海市电力公司
IPC: G06F30/18 , G06F30/25 , G06F16/906 , G06Q10/04 , G06Q50/06 , H02J3/00 , G06F113/04 , G06F119/02
Abstract: 一种采用大数据聚类的基于粒子群原理的配电网数据预处理方法,属配电网可靠性预测领域。对经归一化处理后的配电网数据,采用以弯矩法为主、凹凸系数法为辅的聚类数选取机制,来获得样本最佳的聚类数;在对样本进行聚类分析后,采用上下临界图的异常值识别标准划定诊断阈值;若样本距离聚类中心的距离大于诊断阈值,则判别该样本为离群样本,并剔除;进而得到“除噪”的样本数据;采用经过上述“除噪”处理后的样本数据,对配电网故障潜在规则进行预测。既克服了弯矩法和凹凸系数算法容易陷入局部极值的缺点,又保持了粒子群算法的全局寻优性,同时还具有弯矩法和凹凸系数算法较快的收敛速度;具有除噪效果好,分选正确率和有效性高的优点。
-
-