一种基于二维概率密度估计和四分位法的数据清洗方法
摘要:
本发明属于风电机组数据测量处理技术领域,尤其涉及一种基于二维概率密度估计和四分位法的数据清洗方法,包括:采集风电机组轮毂高度处风速、功率、桨距角数据后归一化预处理,形成样本数据集;采用二维非参数核密度估计方法计算功率和桨距角的联合概率密度函数,并通过网格划分法确定桨距角分界线位置;基于桨距角分界线,将功率和桨距角数据划分为正常数据和异常数据,并采用数据时间对标法得到正常的风速和功率数据;针对清洗后遗漏异常数据,采用四分位法进行数据再清洗。本方法通用性强,可有效识别过渡区域数据类别和科学地清洗大量堆积型限电数据,为风电机组的效能评估、性能分析、状态诊断、健康管理以及功率预测等提供可靠的数据基础。
0/0