-
公开(公告)号:CN117853490B
公开(公告)日:2024-05-24
申请号:CN202410257868.3
申请日:2024-03-06
申请人: 阿里巴巴达摩院(杭州)科技有限公司
IPC分类号: G06T7/00 , G06T7/11 , G06V10/26 , G06V10/44 , G06V10/80 , G06V10/764 , G06V10/82 , G06N3/0455 , G06N3/0464 , G06N3/08
摘要: 本说明书实施例提供图像处理方法、图像处理模型的训练方法,其中图像处理方法包括:接收图像处理任务,其中,图像处理任务携带目标检测区域对应的多个目标图像,图像处理任务用于检测目标检测区域内是否存在异常对象;将多个目标图像输入至图像处理模型,获得目标检测区域对应的检测结果,其中,基于多个目标图像对应的多尺度特征信息生成目标检测区域对应的检测结果,检测结果包括检测标注信息、检测类别信息和检测指导文本。通过获得目标图像对应的多个尺度特征信息提高了后续生成检测结果的准确率。检测结果包括了异常对象的位置信息、待检测对象的信息和指导文本,丰富了检测结果,为用户提供多维度的检测信息,提升了用户的使用体验。
-
公开(公告)号:CN116958659B
公开(公告)日:2024-04-02
申请号:CN202310822213.1
申请日:2023-07-04
申请人: 阿里巴巴达摩院(杭州)科技有限公司
IPC分类号: G06V10/764 , G06V10/82 , G06V10/44 , G06N3/0455 , G06N3/0464 , G06N3/048 , G06N3/08
摘要: 本申请实施例公开了一种图像分类方法、训练图像分类模型的方法及装置。主要技术方案包括:获取待分类的图像;对所述待分类的图像进行特征提取,得到所述图像的特征表示;利用所述图像的特征表示对预先训练得到的多个聚类中心的初始表示进行交叉注意力处理,得到多个聚类中心表示;利用所述图像的特征表示和所述多个聚类中心表示进行解码处理,得到类别分配矩阵;利用所述多个聚类中心表示和所述类别分配矩阵进行分类,得到所述待分类的图像是否属于目标类别的分类结果。通过本申请能够使得图像分类结果具有更高的准确率。
-
公开(公告)号:CN117408946A
公开(公告)日:2024-01-16
申请号:CN202311167052.3
申请日:2023-09-11
申请人: 阿里巴巴达摩院(杭州)科技有限公司
IPC分类号: G06T7/00 , G06V10/774 , G06V10/25 , G06N3/08 , G06V10/764
摘要: 本说明书实施例提供图像处理模型的训练方法、图像处理方法,其中图像处理模型的训练方法包括:获取多个训练样本对,训练样本对包括正训练样本对和负训练样本对,训练样本对包括样本检测区域、多个初始训练样本图像和样本检测结果;对多个初始训练样本图像进行图像处理,获得多个目标训练样本图像;根据多个初始训练样本图像、多个目标训练样本图像输入至图像处理模型,获得目标检测区域对应的预测检测区域、预测检测结果;根据正训练样本对、负训练样本对、样本检测区域、样本检测结果、预测检测区域和预测检测结果计算模型损失值;根据模型损失值调整图像处理模型的模型参数,直至达到模型训练停止条件。
-
公开(公告)号:CN117853490A
公开(公告)日:2024-04-09
申请号:CN202410257868.3
申请日:2024-03-06
申请人: 阿里巴巴达摩院(杭州)科技有限公司
IPC分类号: G06T7/00 , G06T7/11 , G06V10/26 , G06V10/44 , G06V10/80 , G06V10/764 , G06V10/82 , G06N3/0455 , G06N3/0464 , G06N3/08
摘要: 本说明书实施例提供图像处理方法、图像处理模型的训练方法,其中图像处理方法包括:接收图像处理任务,其中,图像处理任务携带目标检测区域对应的多个目标图像,图像处理任务用于检测目标检测区域内是否存在异常对象;将多个目标图像输入至图像处理模型,获得目标检测区域对应的检测结果,其中,基于多个目标图像对应的多尺度特征信息生成目标检测区域对应的检测结果,检测结果包括检测标注信息、检测类别信息和检测指导文本。通过获得目标图像对应的多个尺度特征信息提高了后续生成检测结果的准确率。检测结果包括了异常对象的位置信息、待检测对象的信息和指导文本,丰富了检测结果,为用户提供多维度的检测信息,提升了用户的使用体验。
-
公开(公告)号:CN117152674A
公开(公告)日:2023-12-01
申请号:CN202310896158.0
申请日:2023-07-20
申请人: 阿里巴巴达摩院(杭州)科技有限公司
摘要: 本申请公开了一种图像处理方法、电子设备和计算机可读存储介质。其中,该方法包括:获取不同时间采集到的多期图像,其中,多期图像的显示内容至少包含待监测对象的目标部位的监测区域;对多期图像进行纹理特征提取,得到多期图像的目标纹理特征;基于多期图像中的监测区域和其他区域的位置关系,确定多期图像的目标神经距离,其中,其他区域用于表征目标部位除监测区域之外的区域;基于目标纹理特征和目标神经距离,生成监测区域的风险指标,其中,风险指标用于表征监测区域存在风险的概率。本申请解决了相关技术中确定监测区域是否存在风险的准确度低的技术问题。
-
公开(公告)号:CN117094960A
公开(公告)日:2023-11-21
申请号:CN202311013821.4
申请日:2023-08-11
申请人: 阿里巴巴达摩院(杭州)科技有限公司
IPC分类号: G06T7/00 , G06T7/30 , G06V10/774 , G06V10/82
摘要: 本说明书实施例提供医学影像扫描图像处理方法以及装置,其中所述方法包括:确定目标部位的第一医学影像扫描图像和第二医学影像扫描图像;将第一医学影像扫描图像和第二医学影像扫描图像输入目标图像配准模型,获得第一医学影像扫描图像和第二医学影像扫描图像之间的位移场,其中,目标图像配准模型根据第一训练图像集对初始图像配准模型优化得到,初始图像配准模型根据第二训练图像集预训练得到,第一训练图像集和第二训练图像集不同;根据位移场,对第一医学影像扫描图像进行调整,获得调整后的第一医学影像扫描图像;根据第二医学影像扫描图像和所述调整后的第一医学影像扫描图像,确定目标部位的目标对象位置。
-
公开(公告)号:CN116958659A
公开(公告)日:2023-10-27
申请号:CN202310822213.1
申请日:2023-07-04
申请人: 阿里巴巴达摩院(杭州)科技有限公司
IPC分类号: G06V10/764 , G06V10/82 , G06V10/44 , G06N3/0455 , G06N3/0464 , G06N3/048 , G06N3/08
摘要: 本申请实施例公开了一种图像分类方法、训练图像分类模型的方法及装置。主要技术方案包括:获取待分类的图像;对所述待分类的图像进行特征提取,得到所述图像的特征表示;利用所述图像的特征表示对预先训练得到的多个聚类中心的初始表示进行交叉注意力处理,得到多个聚类中心表示;利用所述图像的特征表示和所述多个聚类中心表示进行解码处理,得到类别分配矩阵;利用所述多个聚类中心表示和所述类别分配矩阵进行分类,得到所述待分类的图像是否属于目标类别的分类结果。通过本申请能够使得图像分类结果具有更高的准确率。
-
-
-
-
-
-