发明公开
CN111125075A 一种不可算台区数据治理方法及系统
无效 - 驳回
- 专利标题: 一种不可算台区数据治理方法及系统
-
申请号: CN201911298485.6申请日: 2019-12-17
-
公开(公告)号: CN111125075A公开(公告)日: 2020-05-08
- 发明人: 李刚 , 刘浩宇 , 李野 , 顾强 , 赵宝国 , 杨光 , 季浩 , 何泽昊 , 董得龙 , 吕伟嘉 , 张兆杰 , 卢静雅 , 翟术然 , 乔亚男 , 陈娟 , 许迪 , 赵紫敬 , 孙虹 , 卫天超
- 申请人: 国网天津市电力公司电力科学研究院 , 国网天津市电力公司 , 国家电网有限公司
- 申请人地址: 天津市西青区海泰华科四路8号
- 专利权人: 国网天津市电力公司电力科学研究院,国网天津市电力公司,国家电网有限公司
- 当前专利权人: 国网天津市电力公司电力科学研究院,国网天津市电力公司,国家电网有限公司
- 当前专利权人地址: 天津市西青区海泰华科四路8号
- 代理机构: 天津盛理知识产权代理有限公司
- 代理商 王来佳
- 主分类号: G06F16/215
- IPC分类号: G06F16/215 ; G06Q50/06
摘要:
本发明涉及一种不可算台区数据治理系统,其特征在于:包括如下步骤:(1)建立持久化原始数据区;(2)建立数据整合区;(3)建立数据汇总区;(4)建设数据质量管理;(5)数据完整性管理、对数据合理性规则进行判定。本发明首先将用电数据中的不可算数据进行了梳理,并针对异常数据情况,提出使用离群点检测来标识异常数据。在此基础上,从数据挖掘的需求出发,综合运用剔除数据,线性插值补齐等方法,针对每一小类数据提出相应的清洗措施,从而获得合格高质量的用电数据,实现自贸区不可算台区的数据的治理,大幅提升整体数据质量。