发明公开
CN111026741A 基于时间序列相似性的数据清洗方法及装置
无效 - 驳回
- 专利标题: 基于时间序列相似性的数据清洗方法及装置
-
申请号: CN201911226611.7申请日: 2019-12-04
-
公开(公告)号: CN111026741A公开(公告)日: 2020-04-17
- 发明人: 李野 , 董得龙 , 李刚 , 卢静雅 , 孔祥玉 , 李予辉 , 孙虹 , 刘浩宇 , 杨光 , 顾强 , 何泽昊 , 季浩 , 白涛 , 乔亚男 , 翟术然 , 张兆杰 , 吕伟嘉 , 许迪 , 赵紫敬
- 申请人: 国网天津市电力公司电力科学研究院 , 国网天津市电力公司 , 国家电网有限公司 , 天津大学
- 申请人地址: 天津市西青区海泰华科四路8号
- 专利权人: 国网天津市电力公司电力科学研究院,国网天津市电力公司,国家电网有限公司,天津大学
- 当前专利权人: 国网天津市电力公司电力科学研究院,国网天津市电力公司,国家电网有限公司,天津大学
- 当前专利权人地址: 天津市西青区海泰华科四路8号
- 代理机构: 天津盛理知识产权代理有限公司
- 代理商 王来佳
- 主分类号: G06F16/215
- IPC分类号: G06F16/215 ; G06F16/2458 ; G06K9/62
摘要:
本发明提供了一种基于时间序列相似性的数据清洗方法及装置,涉及数据清洗技术领域,主要目的是提供一种计算复杂度低、准确率高的数据清洗方法。该基于时间序列相似性的数据清洗方法的技术特点在于,包括以下步骤:步骤1、基于历史样本数据库读取历史数据,并对历史数据进行降维处理;步骤2、采用时间序列符号化方法对历史数据进行离散化处理;步骤3、利用动态时间弯曲算法对数据进行相似性度量以及相似性计算;步骤4、通过设定的阈值对数据进行数据清洗,从而得到清洗后的结果序列。本发明适用于电力负荷大数据应用场景,能够对电力负荷大数据进行快速有效的清洗,得到高质量数据用于后续分析处理。