一种基于大规模样本的聚类结果评价方法及装置

    公开(公告)号:CN111738319A

    公开(公告)日:2020-10-02

    申请号:CN202010531994.5

    申请日:2020-06-11

    IPC分类号: G06K9/62

    摘要: 本申请实施例公开了一种基于大规模样本的聚类结果评价方法及装置。本申请实施例提供的技术方案,通过获取聚类结果,从聚类结果的所有类中随机抽取第一设定数量个类,作为第一抽样类,对第一抽样类的每个类按照设定抽样规则抽取第二设定数量个样本作为抽样样本,基于抽样样本组成第二抽样类,最终根据第二抽样类计算轮廓系数,获取对应的聚类结果评价。采用上述技术手段,通过合理的样本抽样可以减少聚类结果的数据量,在保障抽样样本具备聚类结果的代表性的前提下,降低聚类结果评价计算的复杂度,进而提升聚类结果评价的生成效率。

    一种人脸聚类方法、装置、设备及存储介质

    公开(公告)号:CN112016623A

    公开(公告)日:2020-12-01

    申请号:CN202010888418.6

    申请日:2020-08-28

    IPC分类号: G06K9/62

    摘要: 本发明实施例公开了一种人脸聚类方法、装置、设备及存储介质,该方法包括:将包含人脸的原始图像数据划分至多个第一分组中,在每个第一分组中,查找人脸具有差异性的原始图像数据,作为候选图像数据,查找与候选图像数据的人脸相似的原始图像数据,并划分至多个第二分组中,在每个第二分组中,对原始图像数据进行聚类,获得候选人脸集合,若候选人脸集合之间关于人脸相似,则将候选人脸集合合并为目标人脸集合。将包含人脸的原始图像数据分批次划分至不同的分组进行组内处理,降低了单次数据处理的计算量,节省内存,筛选出候选人脸集合再进行集合的合并,便于构造单个人脸数据的邻域,减少耗时,提高人脸聚类效率。

    一种数据挖掘方法、装置、电子设备及存储介质

    公开(公告)号:CN110825785A

    公开(公告)日:2020-02-21

    申请号:CN201911072865.8

    申请日:2019-11-05

    IPC分类号: G06F16/2458 G06Q50/26

    摘要: 本申请实施例公开了一种数据挖掘方法、装置、电子设备及存储介质。本申请实施例通过获取用于犯罪团伙挖掘的业务数据,将业务数据进行时间切片得到切片数据集,通过提取犯罪嫌疑人在对应时间段的经纬度信息或手机MAC地址信息,与切片数据集进行比对,通过确定经纬度信息或MAC地址信息存在设定关联关系的第一挖掘对象集合,以该第一挖掘对象集合中确定与犯罪嫌疑人为同伙关系的挖掘对象。采用上述技术手段,可以通过信息关联较快地进行犯罪团伙挖掘,避免繁琐的信息查询流程,进而简化同伙挖掘流程,提高信息挖掘效率。

    一种人脸比对的图卷积神经网络训练方法及装置

    公开(公告)号:CN112733807A

    公开(公告)日:2021-04-30

    申请号:CN202110197142.1

    申请日:2021-02-22

    摘要: 本申请实施例公开了一种人脸比对的图卷积神经网络训练方法及装置。本申请实施例提供的技术方案通过确定人脸图片之间的相似度距离,根据相似度距离与邻域半径的比较情况,为每个人脸图片构建人脸图片邻域,并进一步按照相似度分割阈值构造同类低相似度的正样本集和不同类高相似度的负样本集,依据正样本集和负样本集对基于图卷积神经网络构建二分类的多对多人脸识别模型进行训练,以使多对多人脸识别模型的正确率达到设定要求,通过正样本集和负样本集进行模型训练,降低样本数据规模,减少训练时间,提升对人脸识别图卷积神经网络的训练效率,有效强化多对多人脸识别模型的识别能力。

    一种分布式大规模人脸聚类方法及装置

    公开(公告)号:CN111738341A

    公开(公告)日:2020-10-02

    申请号:CN202010587955.7

    申请日:2020-06-24

    IPC分类号: G06K9/62

    摘要: 本申请实施例公开了一种分布式大规模人脸聚类方法及装置。本申请实施例提供的技术方案,通过将待聚类人脸图片进行分批聚类并汇总聚类结果,得到聚类集合和未聚类集合,从聚类集合的每个类中抽取设定数量的人脸图片构成代表类,并计算每一个未聚类人脸图片与每个代表类的相似度距离,得到相似度距离集合,基于相似度距离集合将未聚类人脸图片聚类到最相似的代表类中,并根据设定的链接阈值确定各个未聚类人脸图片与对应的代表类的链接关系,基于链接关系合并各个代表类,输出合并结果。采用上述技术手段,可以减少大规模人脸数据聚类的数据计算量,减少内存的消耗,在保障聚类结果稳定的前提下提升人脸聚类效率。

    一种物理地址的识别方法、装置、计算机设备和存储介质

    公开(公告)号:CN111629374A

    公开(公告)日:2020-09-04

    申请号:CN202010486730.2

    申请日:2020-06-01

    IPC分类号: H04W8/22 H04W12/06

    摘要: 本发明实施例公开了一种物理地址的识别方法、装置、计算机设备和存储介质,该方法包括:获取监测设备在监测终端运行时生成的多份候选运行数据,运行数据中具有监测设备和/或终端的物理地址;查找与监测设备和/或终端的类型适配的候选运行数据,作为目标运行数据;针对监测设备和/或终端的类型,在目标运行数据中计算物理地址在指定维下的统计特征;根据统计特征识别物理地址对于监测设备和/或终端的类型的真伪性。本实施例解除了识别MAC地址真伪性对OUI库的依赖,既可以识别在OUI库中申请对外保密的、真实的MAC地址,也可以识别在OUI库上已记录的、虚假的MAC地址,从而提高了识别MAC地址真伪性的精确度。