- 专利标题: 一种多源数据接入下电力数据标准化清洗方法和装置
-
申请号: CN202110094083.5申请日: 2021-01-22
-
公开(公告)号: CN112783883A公开(公告)日: 2021-05-11
- 发明人: 周立德 , 黎鸣 , 陈凤超 , 梅傲琪 , 胡润锋 , 钟志明 , 邱泽坚 , 何毅鹏 , 黄达区 , 饶欢 , 张锐 , 刘沛林 , 徐睿烽 , 鲁承波
- 申请人: 广东电网有限责任公司东莞供电局
- 申请人地址: 广东省东莞市东城区东城路239号
- 专利权人: 广东电网有限责任公司东莞供电局
- 当前专利权人: 广东电网有限责任公司东莞供电局
- 当前专利权人地址: 广东省东莞市东城区东城路239号
- 代理机构: 广州越华专利代理事务所
- 代理商 陈岑
- 主分类号: G06F16/215
- IPC分类号: G06F16/215 ; G06F16/28 ; G06K9/62
摘要:
本发明涉及一种多源数据接入下电力数据标准化清洗方法,包括:S10、数据初步聚类处理,使用K均值算法对采集到的数据进行读取,根据数据的属性值特征对采集到的数据进行分类,S20、多源数据清洗采用聚类处理后的数据作为数据清洗的数据来源,将处理后的数据设定为数据库形式,并采用现有的数据清洗工具完成多源数据清洗工作。本发明的有益效果是:根据数据的属性值特征对采集到的数据进行分类,采用聚类处理后的数据作为数据清洗的数据来源,将处理后的数据设定为数据库形式,采用现有的数据清洗工具完成多源数据清洗工作,提高数据库数据处理结果的精确度,进而提高清洗数据的准确率。
公开/授权文献
- CN112783883B 一种多源数据接入下数据标准化清洗方法和装置 公开/授权日:2024-09-06