发明公开
- 专利标题: 一种区域企业数据异常行为的大数据识别方法
-
申请号: CN201911299008.1申请日: 2019-12-17
-
公开(公告)号: CN111080502A公开(公告)日: 2020-04-28
- 发明人: 何炜琪 , 陈蓉 , 刘娜
- 申请人: 清华苏州环境创新研究院
- 申请人地址: 江苏省苏州市虎丘区锦峰路158号16栋
- 专利权人: 清华苏州环境创新研究院
- 当前专利权人: 清华苏州环境创新研究院
- 当前专利权人地址: 江苏省苏州市虎丘区锦峰路158号16栋
- 代理机构: 苏州创元专利商标事务所有限公司
- 代理商 范晴; 丁浩秋
- 主分类号: G06Q50/26
- IPC分类号: G06Q50/26 ; G06F17/18
摘要:
本发明公开了一种区域企业数据异常行为的大数据识别方法,包括:将区域企业数据进行数据清洗;对数据清洗后的数据进行预处理,所述预处理包括数据标准化和属性值规范化;建立多种概率分布模型,进行概率分布识别,从多种概率分布模型中判断出与企业数据最为接近的分布模型;根据判断出的分布模型,使用处理后的数据画出该分布的理论累积概率分布图,并与该数据的实际累积概率分布图对比,根据排放标准x处的实际累积概率与理论累积概率的差值判断企业是否存在数据异常行为。本发明是通用、普适的区域企业数据异常行为可能性定量判断方法,基于大数据分析,不依赖于企业具体造假手段,提高执法工作的针对性和有效性。
公开/授权文献
- CN111080502B 一种区域企业数据异常行为的大数据识别方法 公开/授权日:2023-09-08