一种基于交叉验证的台区数据异常甄别方法和装置

    公开(公告)号:CN110807014B

    公开(公告)日:2022-10-14

    申请号:CN201910906640.1

    申请日:2019-09-24

    IPC分类号: G06F16/21 G06F16/28

    摘要: 本发明公开了一种基于交叉验证的台区数据异常甄别方法和装置,首先,对用采数据断点、异常点和现场实际运行数据情况进行统计分析;进而,分别采用原型聚类法、密度聚类法、概率密度法、深度学习方法等四种方法进行异常值的甄别,并比较各模型的异常值判定精度;为避免单一判断准则的随机性与不准确性,将四种模型异常值甄别结果进行相互交叉验证,取其交集为最终的异常值甄别结果;基于已经训练完成的模型,在线监测异常数据,最终建立基于交叉验证的异常数据甄别模型。本发明解决了传统机器学习方法处理海量数据时面临的难度大、效率低、实时性不高等问题。

    一种基于交叉验证的台区数据异常甄别方法和装置

    公开(公告)号:CN110807014A

    公开(公告)日:2020-02-18

    申请号:CN201910906640.1

    申请日:2019-09-24

    IPC分类号: G06F16/21 G06F16/28

    摘要: 本发明公开了一种基于交叉验证的台区数据异常甄别方法和装置,首先,对用采数据断点、异常点和现场实际运行数据情况进行统计分析;进而,分别采用原型聚类法、密度聚类法、概率密度法、深度学习方法等四种方法进行异常值的甄别,并比较各模型的异常值判定精度;为避免单一判断准则的随机性与不准确性,将四种模型异常值甄别结果进行相互交叉验证,取其交集为最终的异常值甄别结果;基于已经训练完成的模型,在线监测异常数据,最终建立基于交叉验证的异常数据甄别模型。本发明解决了传统机器学习方法处理海量数据时面临的难度大、效率低、实时性不高等问题。