一种基于非累积属性的实时欺诈检测方法及装置

    公开(公告)号:CN105930430B

    公开(公告)日:2020-01-07

    申请号:CN201610245288.8

    申请日:2016-04-19

    IPC分类号: G06F16/2458

    摘要: 本发明提供了一种基于非累积属性的实时欺诈检测方法及装置,用于电信信息安全技术领域。本发明装置包括属性设计模块、用户分箱模块、用户离散化模块、评分计算模块以及欺诈判决模块;属性设计模块中选择非累积的属性表征用户的通话习惯,用户分箱模块采用等深分箱,获取被检测用户在每个属性上的离散化结果,评分计算模块计算用户间的曼哈顿距离的最小值,欺诈判决模块根据阈值判断是否发生欺诈。本发明方法用非累积的属性刻画用户的行为特征,根据其通话习惯的相似性进行欺诈识别,采用等深分箱避免高值用户对正态分布偏度的影响,使用曼哈顿距离进行评分计算。本发明计算复杂度低,实现了海量数据实时运算,可在欺诈早期进行识别告警。

    一种面向高维度大数据的子空间聚类方法及装置

    公开(公告)号:CN106909942B

    公开(公告)日:2022-09-13

    申请号:CN201710112771.3

    申请日:2017-02-28

    IPC分类号: G06K9/62 G06F16/28

    摘要: 本发明实施例提供了一种面向高维度大数据的子空间聚类方法及装置,其中,方法包括:针对获取的高维大数据的每行建立第一Map任务,并按照维度对每个第一Map任务中的数据进行分割,得到每个第一Map任务中每个维度的特征值;在第一Reduce节点中,获取并根据每个维度所有特征值的数据区域、预设窗口数、预设窗口合并阈值及预设窗口密度阈值,得到每个维度的1维密集子空间;根据每两个k维密集子空间,确定k+1维候选子空间;针对每个k维密集子空间建立第二Map任务,并获得分布于每个k维密集子空间的所有样本点;在第二Reduce节点中,得到聚类后的k+1维密集子空间。通过本方案可以提升高维度大数据聚类的运行效率。

    一种面向高维度大数据的子空间聚类方法及装置

    公开(公告)号:CN106909942A

    公开(公告)日:2017-06-30

    申请号:CN201710112771.3

    申请日:2017-02-28

    IPC分类号: G06K9/62 G06F17/30

    CPC分类号: G06K9/6218 G06F17/30598

    摘要: 本发明实施例提供了一种面向高维度大数据的子空间聚类方法及装置,其中,方法包括:针对获取的高维大数据的每行建立第一Map任务,并按照维度对每个第一Map任务中的数据进行分割,得到每个第一Map任务中每个维度的特征值;在第一Reduce节点中,获取并根据每个维度所有特征值的数据区域、预设窗口数、预设窗口合并阈值及预设窗口密度阈值,得到每个维度的1维密集子空间;根据每两个k维密集子空间,确定k+1维候选子空间;针对每个k维密集子空间建立第二Map任务,并获得分布于每个k维密集子空间的所有样本点;在第二Reduce节点中,得到聚类后的k+1维密集子空间。通过本方案可以提升高维度大数据聚类的运行效率。

    一种基于非累积属性的实时欺诈检测方法及装置

    公开(公告)号:CN105930430A

    公开(公告)日:2016-09-07

    申请号:CN201610245288.8

    申请日:2016-04-19

    IPC分类号: G06F17/30

    摘要: 本发明提供了一种基于非累积属性的实时欺诈检测方法及装置,用于电信信息安全技术领域。本发明装置包括属性设计模块、用户分箱模块、用户离散化模块、评分计算模块以及欺诈判决模块;属性设计模块中选择非累积的属性表征用户的通话习惯,用户分箱模块采用等深分箱,获取被检测用户在每个属性上的离散化结果,评分计算模块计算用户间的曼哈顿距离的最小值,欺诈判决模块根据阈值判断是否发生欺诈。本发明方法用非累积的属性刻画用户的行为特征,根据其通话习惯的相似性进行欺诈识别,采用等深分箱避免高值用户对正态分布偏度的影响,使用曼哈顿距离进行评分计算。本发明计算复杂度低,实现了海量数据实时运算,可在欺诈早期进行识别告警。