基于流式数据源的真实值发现方法及装置
Abstract:
本发明涉及一种数据挖掘技术领域,是一种基于流式数据源的真实值发现方法及装置,包括获取观测值集合,其中观测值集合包括利用观测值集合的算术平均数和中位数,查找观测值集合中的不正确观测值,移除不正确观测值,对处理后的观测值集合进行分析,判断是否满足终止条件,响应于是,则输出处理后的观测值集合,针对处理后的观测值集合利用真实值估计方法进行真实值估计。本发明基于观测值集合的算术平均数和变化中位数有效检测并移除流式数据源中的不正确数据,没有使用固定的统计特征值,因此能准确剔除不正确数据,为真实估计提供良好的数据基础,避免了因流式数据源的统计特征值不断变化,造成不能准确对数据的真实性进行判断的问题。
Patent Agency Ranking
0/0