一种基于大规模样本的聚类结果评价方法及装置

    公开(公告)号:CN111738319B

    公开(公告)日:2021-09-10

    申请号:CN202010531994.5

    申请日:2020-06-11

    IPC分类号: G06K9/62

    摘要: 本申请实施例公开了一种基于大规模样本的聚类结果评价方法及装置。本申请实施例提供的技术方案,通过获取聚类结果,从聚类结果的所有类中随机抽取第一设定数量个类,作为第一抽样类,对第一抽样类的每个类按照设定抽样规则抽取第二设定数量个样本作为抽样样本,基于抽样样本组成第二抽样类,最终根据第二抽样类计算轮廓系数,获取对应的聚类结果评价。采用上述技术手段,通过合理的样本抽样可以减少聚类结果的数据量,在保障抽样样本具备聚类结果的代表性的前提下,降低聚类结果评价计算的复杂度,进而提升聚类结果评价的生成效率。

    一种分布式大规模人脸聚类方法及装置

    公开(公告)号:CN111738341B

    公开(公告)日:2022-04-26

    申请号:CN202010587955.7

    申请日:2020-06-24

    IPC分类号: G06K9/62

    摘要: 本申请实施例公开了一种分布式大规模人脸聚类方法及装置。本申请实施例提供的技术方案,通过将待聚类人脸图片进行分批聚类并汇总聚类结果,得到聚类集合和未聚类集合,从聚类集合的每个类中抽取设定数量的人脸图片构成代表类,并计算每一个未聚类人脸图片与每个代表类的相似度距离,得到相似度距离集合,基于相似度距离集合将未聚类人脸图片聚类到最相似的代表类中,并根据设定的链接阈值确定各个未聚类人脸图片与对应的代表类的链接关系,基于链接关系合并各个代表类,输出合并结果。采用上述技术手段,可以减少大规模人脸数据聚类的数据计算量,减少内存的消耗,在保障聚类结果稳定的前提下提升人脸聚类效率。

    一种物理地址的识别方法、装置、计算机设备和存储介质

    公开(公告)号:CN111629374A

    公开(公告)日:2020-09-04

    申请号:CN202010486730.2

    申请日:2020-06-01

    IPC分类号: H04W8/22 H04W12/06

    摘要: 本发明实施例公开了一种物理地址的识别方法、装置、计算机设备和存储介质,该方法包括:获取监测设备在监测终端运行时生成的多份候选运行数据,运行数据中具有监测设备和/或终端的物理地址;查找与监测设备和/或终端的类型适配的候选运行数据,作为目标运行数据;针对监测设备和/或终端的类型,在目标运行数据中计算物理地址在指定维下的统计特征;根据统计特征识别物理地址对于监测设备和/或终端的类型的真伪性。本实施例解除了识别MAC地址真伪性对OUI库的依赖,既可以识别在OUI库中申请对外保密的、真实的MAC地址,也可以识别在OUI库上已记录的、虚假的MAC地址,从而提高了识别MAC地址真伪性的精确度。

    一种数据挖掘方法、装置、电子设备及存储介质

    公开(公告)号:CN110825785A

    公开(公告)日:2020-02-21

    申请号:CN201911072865.8

    申请日:2019-11-05

    IPC分类号: G06F16/2458 G06Q50/26

    摘要: 本申请实施例公开了一种数据挖掘方法、装置、电子设备及存储介质。本申请实施例通过获取用于犯罪团伙挖掘的业务数据,将业务数据进行时间切片得到切片数据集,通过提取犯罪嫌疑人在对应时间段的经纬度信息或手机MAC地址信息,与切片数据集进行比对,通过确定经纬度信息或MAC地址信息存在设定关联关系的第一挖掘对象集合,以该第一挖掘对象集合中确定与犯罪嫌疑人为同伙关系的挖掘对象。采用上述技术手段,可以通过信息关联较快地进行犯罪团伙挖掘,避免繁琐的信息查询流程,进而简化同伙挖掘流程,提高信息挖掘效率。

    一种分布式大规模人脸聚类方法及装置

    公开(公告)号:CN111738341A

    公开(公告)日:2020-10-02

    申请号:CN202010587955.7

    申请日:2020-06-24

    IPC分类号: G06K9/62

    摘要: 本申请实施例公开了一种分布式大规模人脸聚类方法及装置。本申请实施例提供的技术方案,通过将待聚类人脸图片进行分批聚类并汇总聚类结果,得到聚类集合和未聚类集合,从聚类集合的每个类中抽取设定数量的人脸图片构成代表类,并计算每一个未聚类人脸图片与每个代表类的相似度距离,得到相似度距离集合,基于相似度距离集合将未聚类人脸图片聚类到最相似的代表类中,并根据设定的链接阈值确定各个未聚类人脸图片与对应的代表类的链接关系,基于链接关系合并各个代表类,输出合并结果。采用上述技术手段,可以减少大规模人脸数据聚类的数据计算量,减少内存的消耗,在保障聚类结果稳定的前提下提升人脸聚类效率。