基于时间序列相似性的数据清洗方法及装置
摘要:
本发明提供了一种基于时间序列相似性的数据清洗方法及装置,涉及数据清洗技术领域,主要目的是提供一种计算复杂度低、准确率高的数据清洗方法。该基于时间序列相似性的数据清洗方法的技术特点在于,包括以下步骤:步骤1、基于历史样本数据库读取历史数据,并对历史数据进行降维处理;步骤2、采用时间序列符号化方法对历史数据进行离散化处理;步骤3、利用动态时间弯曲算法对数据进行相似性度量以及相似性计算;步骤4、通过设定的阈值对数据进行数据清洗,从而得到清洗后的结果序列。本发明适用于电力负荷大数据应用场景,能够对电力负荷大数据进行快速有效的清洗,得到高质量数据用于后续分析处理。
0/0