-
公开(公告)号:CN115019078B
公开(公告)日:2023-01-24
申请号:CN202210946778.6
申请日:2022-08-09
申请人: 阿里巴巴(中国)有限公司
IPC分类号: G06V10/762 , G06V10/75 , G06V10/74
摘要: 本说明书实施例提供数据聚类方法以及装置,其中所述数据聚类方法包括:获取待聚类数据集,并根据所述待聚类数据集中任意两个待聚类数据间的匹配概率,对所述任意两个待聚类数据进行聚类处理,生成中间聚类结果,根据所述中间聚类结果中任意两个待聚类数据间的匹配概率,确定所述中间聚类结果中、每个待聚类数据对应的期望值,其中,所述期望值包括聚类准确度期望值和/或聚类分裂度期望值,根据所述期望值,对所述中间聚类结果进行调整,生成对应的目标聚类结果。
-
公开(公告)号:CN114596453A
公开(公告)日:2022-06-07
申请号:CN202210116472.8
申请日:2022-02-07
申请人: 阿里巴巴(中国)有限公司
摘要: 本发明公开了一种图像处理方法、装置及计算机可读存储介质。其中,该方法包括:获取第一图像和第二图像;确定第一图像与第二图像的差异部分;提取差异部分对应的差异特征;基于差异特征,确定第一图像与第二图像之间的相似性。其中,在提取差异部分对应的差异特征时,可以基于多层次提取的差异特征递进地放大比对,得到差异特征的深度网络描述;基于差异特征的深度网络描述确定第一图像与第二图像之间的相似性。即通过多层次的递进地方式获取差异特征,能够有效地提升相似性结果的准确性,进而有效地本发明解决了在判断不同图像中的特定主体是否相同时识别效率较差,精度不够和准确率不高的技术问题。
-
公开(公告)号:CN114357263A
公开(公告)日:2022-04-15
申请号:CN202111510906.4
申请日:2021-12-10
申请人: 阿里巴巴(中国)有限公司
IPC分类号: G06F16/906 , G06K9/62
摘要: 本发明公开了一种目标对象的多模态信息的处理方法、装置及存储介质。其中,该方法包括:获取多个目标对象在多模态下的多模态信息,其中,多模态信息包括:任意一个目标对象在每种模态下的度量距离;基于多模态信息,计算得到任意两个目标对象之间的后验匹配概率,其中,目标对象为待聚类的对象;基于任意两个目标对象之间的后验匹配概率,对所有的目标对象进行多模态对象的聚类,生成聚类结果。本发明解决了相关技术的聚类方法中,难以高效、准确地实现对象聚类的技术问题。
-
公开(公告)号:CN115908882A
公开(公告)日:2023-04-04
申请号:CN202211166772.3
申请日:2022-09-23
申请人: 阿里巴巴(中国)有限公司
IPC分类号: G06V10/762 , G06V10/74 , G06V20/40
摘要: 本说明书实施例提供图片聚类方法及装置,该方法包括确定待聚类图片集合;根据预设近邻算法对所述待聚类图片集合中待聚类图片进行压缩,根据压缩后的待聚类图片确定目标待聚类图片、与其他待聚类图片的图片距离;根据所述图片距离将待聚类图片集合中的待聚类图片进行连通,并根据预设聚类方法对连通后的待聚类图片进行聚类,获得图片聚类结果。该图片聚类方法利用了高召回向量检索或者低召回向量检索下连通图划分基本稳定的特性,使用预设近邻算法对待聚类图片进行独立子图拆解,根据拆解后的独立子图进行图片聚类,大幅减少了内存以及计算资源占用,解决了在大规模聚类场景下,由于图片数量较多,导致图片聚类过程中聚类算法无法运行的问题。
-
公开(公告)号:CN115019078A
公开(公告)日:2022-09-06
申请号:CN202210946778.6
申请日:2022-08-09
申请人: 阿里巴巴(中国)有限公司
IPC分类号: G06V10/762 , G06V10/75 , G06V10/74
摘要: 本说明书实施例提供数据聚类方法以及装置,其中所述数据聚类方法包括:获取待聚类数据集,并根据所述待聚类数据集中任意两个待聚类数据间的匹配概率,对所述任意两个待聚类数据进行聚类处理,生成中间聚类结果,根据所述中间聚类结果中任意两个待聚类数据间的匹配概率,确定所述中间聚类结果中、每个待聚类数据对应的期望值,其中,所述期望值包括聚类准确度期望值和/或聚类分裂度期望值,根据所述期望值,对所述中间聚类结果进行调整,生成对应的目标聚类结果。
-
公开(公告)号:CN114416786A
公开(公告)日:2022-04-29
申请号:CN202111493756.0
申请日:2021-12-08
申请人: 阿里巴巴(中国)有限公司
IPC分类号: G06F16/2455 , G06F16/28
摘要: 本发明公开了一种流数据的处理方法、装置、存储介质及计算机设备。其中,该方法包括:解析流数据,生成解析结果;对解析结果进行分批次聚类,得到多个批次的聚类结果,其中,每个批次的聚类结果中包含:至少两条记录以及任意两条记录之间的匹配概率;对任意一个聚类结果中包含的一条或多条记录进行评估,确定任意两条或多条记录均属于目标记录的概率;基于任意两条或多条记录均属于目标记录的概率,对任意一个聚类结果进行优化处理,其中,优化处理包括如下任意一种或多种方式:拆分、合并、删除和替换。本发明解决了相关技术中在进行多批次聚类处理时,难以确定聚类处理质量的技术问题。
-
-
-
-
-