-
公开(公告)号:CN111061714A
公开(公告)日:2020-04-24
申请号:CN201911275484.X
申请日:2019-12-12
申请人: 清华大学
IPC分类号: G06F16/215
摘要: 本发明实施例提供一种时间戳修复方法及装置,该方法包括:基于密度异常检测算法对数据点进行异常检测,得到异常数据点集合信息;基于任意最优求解方法对异常数据点集合信息进行分析,得到目标时间戳修改信息;根据目标时间戳修改信息对异常数据点集合信息进行时间戳修复,得到修复后的时间戳属性信息。通过密度异常检测算法对数据点进行异常数据点标记,并得到异常数据点集合,针对于异常数据点进行最小时间戳修复,从而实现对于异常数据点的修复,并将修复的异常数据点从异常数据点集合信息中删除,并将其添加到正常数据点中,从而实现对于数据点的分布以及密度的改变,避免了修复后的数据和原始数据之间差距过大而导致的信息丢失的问题。
-
公开(公告)号:CN115185932A
公开(公告)日:2022-10-14
申请号:CN202210663208.6
申请日:2022-06-13
申请人: 清华大学
IPC分类号: G06F16/215 , G06F16/2458
摘要: 本申请实施例提供一种数据处理方法及装置,其中,方法包括:从终端设备获取待处理时序数据,所述待处理时序数据中包括N个数据点,N为大于1的整数;根据所述待处理时序数据,确定满足预设条件的异常数据点并标记所述异常数据点;所述预设条件用于筛选出下述任一种或多种异常的数据点:时间戳缺失异常、数值为空值异常、相邻数据点的时间间隔不满足采集间隔条件异常、数值分布异常、数值变化速度分布异常或数值变化加速度分布异常。可有效反馈时序数据的可用性,有助于提高时序数据分析或挖掘结果的精确性。
-