变压器油色谱数据的迭代式清洗方法
Abstract:
一种变压器油色谱数据的迭代式清洗方法,属于数据清洗技术领域。本发明针对变压器油色谱数据中的劣质数据不能被有效识别并清洗的问题。包括:将原始数据集中的数据分为违反规则数据集和符合规则数据集;采用符合规则数据集对分类器进行预训练;采用分类器计算违反规则数据的违反分数,并选择待修复数据;将待修复数据进行修复后,采用修复后数据对分类器进行再训练并对分类器的模型参数进行再更新,迭代以上的“挑选‑修复‑更新”流程,提升分类器的效果;最后采用训练后的分类器对实际运行数据中的违反规则运行数据进行预测,得到清洗后数据。本发明用于油色谱数据的清洗。
Patent Agency Ranking
0/0