-
公开(公告)号:CN115019078B
公开(公告)日:2023-01-24
申请号:CN202210946778.6
申请日:2022-08-09
申请人: 阿里巴巴(中国)有限公司
IPC分类号: G06V10/762 , G06V10/75 , G06V10/74
摘要: 本说明书实施例提供数据聚类方法以及装置,其中所述数据聚类方法包括:获取待聚类数据集,并根据所述待聚类数据集中任意两个待聚类数据间的匹配概率,对所述任意两个待聚类数据进行聚类处理,生成中间聚类结果,根据所述中间聚类结果中任意两个待聚类数据间的匹配概率,确定所述中间聚类结果中、每个待聚类数据对应的期望值,其中,所述期望值包括聚类准确度期望值和/或聚类分裂度期望值,根据所述期望值,对所述中间聚类结果进行调整,生成对应的目标聚类结果。
-
公开(公告)号:CN115346104A
公开(公告)日:2022-11-15
申请号:CN202210968163.3
申请日:2022-08-12
申请人: 阿里巴巴(中国)有限公司
IPC分类号: G06V10/94 , G06V10/764 , G06V20/40 , G06V20/54 , G06V20/20
摘要: 本发明公开了一种图像处理方法和系统。其中,该方法包括:获取来自边端的原始云端模型,其中,原始云端模型为由视频数据集对原始边端模型训练而得到,视频数据集为边端采用不同图像采集设备在第一时刻监测而得到;基于原始云端模型对待监测场景中的输入图像进行图像识别,得到特征向量;基于特征向量训练得到目标云端模型;采用不同图像采集设备在第二时刻监测到的视频数据集对目标云端模型进行训练,得到目标边端模型,其中,目标边端模型用于更新原始边端模型,使得边端基于目标边端模型分别识别不同图像采集设备在第三时刻监测到的视频数据集。本发明解决了对模型更新的效率低的技术问题。
-
公开(公告)号:CN114596453A
公开(公告)日:2022-06-07
申请号:CN202210116472.8
申请日:2022-02-07
申请人: 阿里巴巴(中国)有限公司
摘要: 本发明公开了一种图像处理方法、装置及计算机可读存储介质。其中,该方法包括:获取第一图像和第二图像;确定第一图像与第二图像的差异部分;提取差异部分对应的差异特征;基于差异特征,确定第一图像与第二图像之间的相似性。其中,在提取差异部分对应的差异特征时,可以基于多层次提取的差异特征递进地放大比对,得到差异特征的深度网络描述;基于差异特征的深度网络描述确定第一图像与第二图像之间的相似性。即通过多层次的递进地方式获取差异特征,能够有效地提升相似性结果的准确性,进而有效地本发明解决了在判断不同图像中的特定主体是否相同时识别效率较差,精度不够和准确率不高的技术问题。
-
公开(公告)号:CN114357263A
公开(公告)日:2022-04-15
申请号:CN202111510906.4
申请日:2021-12-10
申请人: 阿里巴巴(中国)有限公司
IPC分类号: G06F16/906 , G06K9/62
摘要: 本发明公开了一种目标对象的多模态信息的处理方法、装置及存储介质。其中,该方法包括:获取多个目标对象在多模态下的多模态信息,其中,多模态信息包括:任意一个目标对象在每种模态下的度量距离;基于多模态信息,计算得到任意两个目标对象之间的后验匹配概率,其中,目标对象为待聚类的对象;基于任意两个目标对象之间的后验匹配概率,对所有的目标对象进行多模态对象的聚类,生成聚类结果。本发明解决了相关技术的聚类方法中,难以高效、准确地实现对象聚类的技术问题。
-
公开(公告)号:CN115908882A
公开(公告)日:2023-04-04
申请号:CN202211166772.3
申请日:2022-09-23
申请人: 阿里巴巴(中国)有限公司
IPC分类号: G06V10/762 , G06V10/74 , G06V20/40
摘要: 本说明书实施例提供图片聚类方法及装置,该方法包括确定待聚类图片集合;根据预设近邻算法对所述待聚类图片集合中待聚类图片进行压缩,根据压缩后的待聚类图片确定目标待聚类图片、与其他待聚类图片的图片距离;根据所述图片距离将待聚类图片集合中的待聚类图片进行连通,并根据预设聚类方法对连通后的待聚类图片进行聚类,获得图片聚类结果。该图片聚类方法利用了高召回向量检索或者低召回向量检索下连通图划分基本稳定的特性,使用预设近邻算法对待聚类图片进行独立子图拆解,根据拆解后的独立子图进行图片聚类,大幅减少了内存以及计算资源占用,解决了在大规模聚类场景下,由于图片数量较多,导致图片聚类过程中聚类算法无法运行的问题。
-
公开(公告)号:CN115019078A
公开(公告)日:2022-09-06
申请号:CN202210946778.6
申请日:2022-08-09
申请人: 阿里巴巴(中国)有限公司
IPC分类号: G06V10/762 , G06V10/75 , G06V10/74
摘要: 本说明书实施例提供数据聚类方法以及装置,其中所述数据聚类方法包括:获取待聚类数据集,并根据所述待聚类数据集中任意两个待聚类数据间的匹配概率,对所述任意两个待聚类数据进行聚类处理,生成中间聚类结果,根据所述中间聚类结果中任意两个待聚类数据间的匹配概率,确定所述中间聚类结果中、每个待聚类数据对应的期望值,其中,所述期望值包括聚类准确度期望值和/或聚类分裂度期望值,根据所述期望值,对所述中间聚类结果进行调整,生成对应的目标聚类结果。
-
公开(公告)号:CN115035462B
公开(公告)日:2023-01-24
申请号:CN202210952352.1
申请日:2022-08-09
申请人: 阿里巴巴(中国)有限公司
IPC分类号: G06V20/40 , G06V10/80 , G06V10/764
摘要: 本申请提供一种视频识别方法、装置、设备和存储介质,该方法包括:获取需要进行类别识别的视频;通过第一网络模型提取视频对应的第一特征矩阵,并根据第一特征矩阵确定视频对应的topk个类别;根据topk个类别以及第一特征矩阵生成与topk个类别相关的概要信息;基于所述概要信息,通过第二网络模型提取视频对应的第二特征矩阵,并根据第二特征矩阵确定视频对应的目标类别,目标类别为topk个类别中的一个。基于上述从概要到细节的识别思路,有助于提取到包含更多关键细节的用于识别出目标类别的特征信息,从而可以实现输入视频的准确类别识别,且节省算力。基于该方案可以实现按照其中的人物行为类别对视频进行分类。
-
公开(公告)号:CN115019218B
公开(公告)日:2022-11-15
申请号:CN202210941398.3
申请日:2022-08-08
申请人: 阿里巴巴(中国)有限公司
IPC分类号: G06V20/20 , G06V20/54 , G06V10/764 , G06V10/774 , G06V10/82 , G06N3/04 , G06N3/08
摘要: 本发明公开了一种图像处理方法和处理器。其中,该方法包括:采集监测到的待识别图像,其中,待识别图像中包含了需要监测的至少一种目标对象;调用图像预测模型,其中,图像预测模型为分别对相同的图像样本在不同标签状态下的不同增广视图进行训练而生成;使用图像预测模型对待识别图像进行图像分类处理,识别出待识别图像中包含的任意一个目标对象的不同标签的标签状态,以及不同标签之间的关联关系;基于目标对象的不同标签的标签状态,以及不同标签之间的关联关系,确定待识别图像中目标对象的识别结果;输出图像中目标对象的识别结果。本发明解决了图像识别的精度低的技术问题。
-
公开(公告)号:CN115035462A
公开(公告)日:2022-09-09
申请号:CN202210952352.1
申请日:2022-08-09
申请人: 阿里巴巴(中国)有限公司
IPC分类号: G06V20/40 , G06V10/80 , G06V10/764
摘要: 本申请提供一种视频识别方法、装置、设备和存储介质,该方法包括:获取需要进行类别识别的视频;通过第一网络模型提取视频对应的第一特征矩阵,并根据第一特征矩阵确定视频对应的topk个类别;根据topk个类别以及第一特征矩阵生成与topk个类别相关的概要信息;基于所述概要信息,通过第二网络模型提取视频对应的第二特征矩阵,并根据第二特征矩阵确定视频对应的目标类别,目标类别为topk个类别中的一个。基于上述从概要到细节的识别思路,有助于提取到包含更多关键细节的用于识别出目标类别的特征信息,从而可以实现输入视频的准确类别识别,且节省算力。基于该方案可以实现按照其中的人物行为类别对视频进行分类。
-
公开(公告)号:CN115019218A
公开(公告)日:2022-09-06
申请号:CN202210941398.3
申请日:2022-08-08
申请人: 阿里巴巴(中国)有限公司
IPC分类号: G06V20/20 , G06V20/54 , G06V10/764 , G06V10/774 , G06V10/82 , G06N3/04 , G06N3/08
摘要: 本发明公开了一种图像处理方法和处理器。其中,该方法包括:采集监测到的待识别图像,其中,待识别图像中包含了需要监测的至少一种目标对象;调用图像预测模型,其中,图像预测模型为分别对相同的图像样本在不同标签状态下的不同增广视图进行训练而生成;使用图像预测模型对待识别图像进行图像分类处理,识别出待识别图像中包含的任意一个目标对象的不同标签的标签状态,以及不同标签之间的关联关系;基于目标对象的不同标签的标签状态,以及不同标签之间的关联关系,确定待识别图像中目标对象的识别结果;输出图像中目标对象的识别结果。本发明解决了图像识别的精度低的技术问题。
-
-
-
-
-
-
-
-
-