发明公开
CN118295989A 一种数据清洗方法及装置
审中-实审
- 专利标题: 一种数据清洗方法及装置
-
申请号: CN202310004733.1申请日: 2023-01-03
-
公开(公告)号: CN118295989A公开(公告)日: 2024-07-05
- 发明人: 韦琬 , 王果 , 孙华凯 , 杨传书 , 魏卓 , 徐术国 , 李昌盛 , 张好林 , 张词
- 申请人: 中国石油化工股份有限公司 , 中石化石油工程技术研究院有限公司
- 申请人地址: 北京市朝阳区朝阳门北大街22号;
- 专利权人: 中国石油化工股份有限公司,中石化石油工程技术研究院有限公司
- 当前专利权人: 中国石油化工股份有限公司,中石化石油工程技术研究院有限公司
- 当前专利权人地址: 北京市朝阳区朝阳门北大街22号;
- 代理机构: 北京聿宏知识产权代理有限公司
- 代理商 郑哲琦; 吴昊
- 主分类号: G06F16/215
- IPC分类号: G06F16/215 ; G06T11/20
摘要:
本发明实施例提供了一种数据清洗方法及装置,解决了油田现场计算、分析和决策效率低下和可靠性低的问题。包括:获取油田现场参数数据,基于参数数据绘制第一二维散点图,并统计清洗前的参数数据的总数据量;基于所述第一二维散点图得到第一二维分区网格图,基于所述第一二维分区网格图得到每个网格的数据密度,基于每个网格的数据密度绘制数据密度曲线;在数据密度曲线上标定所有拐点,基于所述拐点的数据密度值得到第一数据密度阈值;对比所述第一数据密度阈值和每个网格的数据密度,根据对比结果对数据进行初级清洗;对初级清洗后的数据进行一维分区,并获取每个区间内的数据的中位数;清除区间的中位数外的所有数据,以对数据进行二级清洗。