-
公开(公告)号:CN111738319A
公开(公告)日:2020-10-02
申请号:CN202010531994.5
申请日:2020-06-11
申请人: 佳都新太科技股份有限公司 , 广州佳都科技软件开发有限公司
IPC分类号: G06K9/62
摘要: 本申请实施例公开了一种基于大规模样本的聚类结果评价方法及装置。本申请实施例提供的技术方案,通过获取聚类结果,从聚类结果的所有类中随机抽取第一设定数量个类,作为第一抽样类,对第一抽样类的每个类按照设定抽样规则抽取第二设定数量个样本作为抽样样本,基于抽样样本组成第二抽样类,最终根据第二抽样类计算轮廓系数,获取对应的聚类结果评价。采用上述技术手段,通过合理的样本抽样可以减少聚类结果的数据量,在保障抽样样本具备聚类结果的代表性的前提下,降低聚类结果评价计算的复杂度,进而提升聚类结果评价的生成效率。
-
公开(公告)号:CN112016623A
公开(公告)日:2020-12-01
申请号:CN202010888418.6
申请日:2020-08-28
申请人: 佳都新太科技股份有限公司 , 广州佳都科技软件开发有限公司
IPC分类号: G06K9/62
摘要: 本发明实施例公开了一种人脸聚类方法、装置、设备及存储介质,该方法包括:将包含人脸的原始图像数据划分至多个第一分组中,在每个第一分组中,查找人脸具有差异性的原始图像数据,作为候选图像数据,查找与候选图像数据的人脸相似的原始图像数据,并划分至多个第二分组中,在每个第二分组中,对原始图像数据进行聚类,获得候选人脸集合,若候选人脸集合之间关于人脸相似,则将候选人脸集合合并为目标人脸集合。将包含人脸的原始图像数据分批次划分至不同的分组进行组内处理,降低了单次数据处理的计算量,节省内存,筛选出候选人脸集合再进行集合的合并,便于构造单个人脸数据的邻域,减少耗时,提高人脸聚类效率。
-
公开(公告)号:CN110825785A
公开(公告)日:2020-02-21
申请号:CN201911072865.8
申请日:2019-11-05
申请人: 佳都新太科技股份有限公司 , 广州佳都科技软件开发有限公司
IPC分类号: G06F16/2458 , G06Q50/26
摘要: 本申请实施例公开了一种数据挖掘方法、装置、电子设备及存储介质。本申请实施例通过获取用于犯罪团伙挖掘的业务数据,将业务数据进行时间切片得到切片数据集,通过提取犯罪嫌疑人在对应时间段的经纬度信息或手机MAC地址信息,与切片数据集进行比对,通过确定经纬度信息或MAC地址信息存在设定关联关系的第一挖掘对象集合,以该第一挖掘对象集合中确定与犯罪嫌疑人为同伙关系的挖掘对象。采用上述技术手段,可以通过信息关联较快地进行犯罪团伙挖掘,避免繁琐的信息查询流程,进而简化同伙挖掘流程,提高信息挖掘效率。
-
公开(公告)号:CN112733807A
公开(公告)日:2021-04-30
申请号:CN202110197142.1
申请日:2021-02-22
申请人: 佳都新太科技股份有限公司 , 广州佳都科技软件开发有限公司
摘要: 本申请实施例公开了一种人脸比对的图卷积神经网络训练方法及装置。本申请实施例提供的技术方案通过确定人脸图片之间的相似度距离,根据相似度距离与邻域半径的比较情况,为每个人脸图片构建人脸图片邻域,并进一步按照相似度分割阈值构造同类低相似度的正样本集和不同类高相似度的负样本集,依据正样本集和负样本集对基于图卷积神经网络构建二分类的多对多人脸识别模型进行训练,以使多对多人脸识别模型的正确率达到设定要求,通过正样本集和负样本集进行模型训练,降低样本数据规模,减少训练时间,提升对人脸识别图卷积神经网络的训练效率,有效强化多对多人脸识别模型的识别能力。
-
公开(公告)号:CN111738341A
公开(公告)日:2020-10-02
申请号:CN202010587955.7
申请日:2020-06-24
申请人: 佳都新太科技股份有限公司 , 广州佳都科技软件开发有限公司
IPC分类号: G06K9/62
摘要: 本申请实施例公开了一种分布式大规模人脸聚类方法及装置。本申请实施例提供的技术方案,通过将待聚类人脸图片进行分批聚类并汇总聚类结果,得到聚类集合和未聚类集合,从聚类集合的每个类中抽取设定数量的人脸图片构成代表类,并计算每一个未聚类人脸图片与每个代表类的相似度距离,得到相似度距离集合,基于相似度距离集合将未聚类人脸图片聚类到最相似的代表类中,并根据设定的链接阈值确定各个未聚类人脸图片与对应的代表类的链接关系,基于链接关系合并各个代表类,输出合并结果。采用上述技术手段,可以减少大规模人脸数据聚类的数据计算量,减少内存的消耗,在保障聚类结果稳定的前提下提升人脸聚类效率。
-
公开(公告)号:CN111259657A
公开(公告)日:2020-06-09
申请号:CN202010033448.9
申请日:2020-01-13
申请人: 佳都新太科技股份有限公司 , 广州佳都科技软件开发有限公司 , 广州新科佳都科技有限公司
IPC分类号: G06F40/279 , G06F40/30 , G06F40/126
摘要: 本发明实施例公开了一种车站名称识别方法、装置、设备及存储介质,涉及数据处理技术领域,其包括:获取基于用户的语音请求数据得到的文本识别结果;查找所述文本识别结果中出现的备选车站名称;生成所述备选车站名称的正则表达式,并根据所述正则表达式在车站名称集合中匹配相关的目标车站名称,所述正则表达式为拼音的混淆发音表达式;利用所述目标车站名称替换所述文本识别结果中的所述备选车站名称,以得到最终文本识别结果。采用上述方案可以解决现有技术中,由于用户混淆发音而无法对语音数据进行正确识别的技术问题。
-
公开(公告)号:CN111242040A
公开(公告)日:2020-06-05
申请号:CN202010040705.1
申请日:2020-01-15
申请人: 佳都新太科技股份有限公司 , 广州佳都科技软件开发有限公司 , 广州新科佳都科技有限公司
摘要: 本申请实施例公开了一种动态人脸聚类方法、装置、设备和存储介质。该方法包括对批量人脸图片进行静态聚类处理,得到多个包括邻居人脸集合的簇,根据每个簇中每张人脸图片相对于簇中其他人脸图片的平均相似度,对每个簇中的人脸图片进行筛选,从每个簇中选取多张人脸图片分别建立档案,根据档案的邻居相似度对满足邻居合并条件的簇进行合并,并基于合并后的簇重新建立档案,根据新增人脸图片与每个档案中的人脸图片的平均相似度,确定所述新增人脸图片所对应的档案,将所述新增人脸图片加入所述档案对应的簇中。本方案提高了人脸聚类的效率。
-
公开(公告)号:CN111629374A
公开(公告)日:2020-09-04
申请号:CN202010486730.2
申请日:2020-06-01
申请人: 佳都新太科技股份有限公司 , 广州佳都科技软件开发有限公司
摘要: 本发明实施例公开了一种物理地址的识别方法、装置、计算机设备和存储介质,该方法包括:获取监测设备在监测终端运行时生成的多份候选运行数据,运行数据中具有监测设备和/或终端的物理地址;查找与监测设备和/或终端的类型适配的候选运行数据,作为目标运行数据;针对监测设备和/或终端的类型,在目标运行数据中计算物理地址在指定维下的统计特征;根据统计特征识别物理地址对于监测设备和/或终端的类型的真伪性。本实施例解除了识别MAC地址真伪性对OUI库的依赖,既可以识别在OUI库中申请对外保密的、真实的MAC地址,也可以识别在OUI库上已记录的、虚假的MAC地址,从而提高了识别MAC地址真伪性的精确度。
-
公开(公告)号:CN111261165A
公开(公告)日:2020-06-09
申请号:CN202010033625.3
申请日:2020-01-13
申请人: 佳都新太科技股份有限公司 , 广州佳都科技软件开发有限公司 , 广州新科佳都科技有限公司
摘要: 本发明实施例公开了一种车站名称识别方法、装置、设备及存储介质,涉及数据处理技术领域,其包括:获取基于用户的语音请求数据得到的字符识别结果以及与所述字符识别结果对应的备选车站名称集合;计算所述备选车站名称集合中每个备选车站名称的匹配评价分数,所述匹配评价分数包括:字符统计分数和/或字符排序分数;根据所述匹配评价分数选择至少一个备选车站名称作为所述语音请求数据的车站名称识别结果。采用上述方案可以解决现有技术中,在文本提取时,无法在降低对数据集的要求时,保证泛化能力的技术问题。
-
公开(公告)号:CN110807052A
公开(公告)日:2020-02-18
申请号:CN201911072846.5
申请日:2019-11-05
申请人: 佳都新太科技股份有限公司 , 广州佳都科技软件开发有限公司
IPC分类号: G06F16/2458 , G06F16/28
摘要: 本发明实施例公开了一种用户群分类方法、装置、设备及存储介质,涉及数据处理技术领域,其包括:获取用户群中每位用户在各维度下的行为数据,每个所述维度对应至少一类所述行为数据;根据所述行为数据确定每个所述维度下各所述用户之间的行为相似度;根据所述行为相似度计算基于全部所述维度的用户之间的最终相似度;根据所述最终相似度对所述用户群进行分类。采用上述方案可以解决现有技术中嫌疑人团伙确定方案准确度低、应用场景单一的技术问题。
-
-
-
-
-
-
-
-
-