Invention Publication
CN111026741A 基于时间序列相似性的数据清洗方法及装置
无效 - 驳回
- Patent Title: 基于时间序列相似性的数据清洗方法及装置
-
Application No.: CN201911226611.7Application Date: 2019-12-04
-
Publication No.: CN111026741APublication Date: 2020-04-17
- Inventor: 李野 , 董得龙 , 李刚 , 卢静雅 , 孔祥玉 , 李予辉 , 孙虹 , 刘浩宇 , 杨光 , 顾强 , 何泽昊 , 季浩 , 白涛 , 乔亚男 , 翟术然 , 张兆杰 , 吕伟嘉 , 许迪 , 赵紫敬
- Applicant: 国网天津市电力公司电力科学研究院 , 国网天津市电力公司 , 国家电网有限公司 , 天津大学
- Applicant Address: 天津市西青区海泰华科四路8号
- Assignee: 国网天津市电力公司电力科学研究院,国网天津市电力公司,国家电网有限公司,天津大学
- Current Assignee: 国网天津市电力公司电力科学研究院,国网天津市电力公司,国家电网有限公司,天津大学
- Current Assignee Address: 天津市西青区海泰华科四路8号
- Agency: 天津盛理知识产权代理有限公司
- Agent 王来佳
- Main IPC: G06F16/215
- IPC: G06F16/215 ; G06F16/2458 ; G06K9/62

Abstract:
本发明提供了一种基于时间序列相似性的数据清洗方法及装置,涉及数据清洗技术领域,主要目的是提供一种计算复杂度低、准确率高的数据清洗方法。该基于时间序列相似性的数据清洗方法的技术特点在于,包括以下步骤:步骤1、基于历史样本数据库读取历史数据,并对历史数据进行降维处理;步骤2、采用时间序列符号化方法对历史数据进行离散化处理;步骤3、利用动态时间弯曲算法对数据进行相似性度量以及相似性计算;步骤4、通过设定的阈值对数据进行数据清洗,从而得到清洗后的结果序列。本发明适用于电力负荷大数据应用场景,能够对电力负荷大数据进行快速有效的清洗,得到高质量数据用于后续分析处理。
Information query