一种区域企业数据异常行为的大数据识别方法
摘要:
本发明公开了一种区域企业数据异常行为的大数据识别方法,包括:将区域企业数据进行数据清洗;对数据清洗后的数据进行预处理,所述预处理包括数据标准化和属性值规范化;建立多种概率分布模型,进行概率分布识别,从多种概率分布模型中判断出与企业数据最为接近的分布模型;根据判断出的分布模型,使用处理后的数据画出该分布的理论累积概率分布图,并与该数据的实际累积概率分布图对比,根据排放标准x处的实际累积概率与理论累积概率的差值判断企业是否存在数据异常行为。本发明是通用、普适的区域企业数据异常行为可能性定量判断方法,基于大数据分析,不依赖于企业具体造假手段,提高执法工作的针对性和有效性。
公开/授权文献
0/0