-
公开(公告)号:CN116912562A
公开(公告)日:2023-10-20
申请号:CN202310777176.7
申请日:2023-06-28
申请人: 中国移动通信集团有限公司研究院 , 清华大学
IPC分类号: G06V10/764 , G06V10/40 , G06V20/70 , G06V10/82 , G06V10/774
摘要: 本发明提供了一种图片处理方法及装置,属于人工智能技术领域。图片处理方法,包括:将待处理的图片输入神经网络分类模型的特征提取器,得到所述图片的特征;将所述图片的特征输入语义方向预测网络模型,得到所述图片具有意义的第一语义方向;将所述图片的特征,沿着所述第一语义方向进行增强,得到增强后的特征;将所述增强后的特征,输入所述神经网络分类模型的分类器,得到所述图片的分类结果。本发明的技术方案能够避免在图像域上做数据增强时破坏分类信息。
-
公开(公告)号:CN116935099A
公开(公告)日:2023-10-24
申请号:CN202310724500.9
申请日:2023-06-19
申请人: 中国移动通信集团有限公司研究院 , 清华大学
IPC分类号: G06V10/764 , G06V10/96
摘要: 本申请公开了一种图像处理方法、装置、电子设备及可读存储介质,属于人工智能技术领域。本申请实施例的图像处理方法包括:获取待分类图像;将所述待分类图像输入到图像分类模型中,执行所述图像分类模型的特征提取分支和分类分支对所述待分类图像进行处理;所述特征提取分支和所述分类分支分别具有m个阶段;在执行完所述分类分支的第n阶段之后,根据所述分类分支的第n阶段的输出,利用所述分类分支的第n阶段之后的分类器对所述待分类图像进行分类,获得分类结果,1<n≤m;在所述分类结果的置信度大于或等于预设阈值的情况下,输出所述分类结果,并退出所述图像分类模型。由此,可以实现动态早退机制,从而提升图像处理效率。
-
公开(公告)号:CN116958616A
公开(公告)日:2023-10-27
申请号:CN202210373908.1
申请日:2022-04-11
申请人: 中国移动通信有限公司研究院 , 清华大学 , 中国移动通信集团有限公司
IPC分类号: G06V10/764 , G06V10/774 , G06N3/084
摘要: 本申请提供一种分类模型训练方法、图像识别方法及相关设备,分类模型训练方法包括:使用图像分类模型分别对多个第一样本数据进行前向传播计算,以得到多个第一样本数据的第一损失值,图像分类模型包括多个出口,每一第一样本数据的第一损失值包括在多个出口的损失值,多个第一样本数据为第一采样得到的图像帧数据;使用权重预测模型对多个第一样本数据的第一损失值进行权重预测,得到多个第一样本数据分别在每一出口的目标权重;基于多个第一样本数据分别在每一出口的预测权重,以及多个第一样本数据的第一损失值,对图像分类模型进行训练,得到用于对图像进行分类的图像分类模型。本申请可以提升模型性能。
-
公开(公告)号:CN116883675A
公开(公告)日:2023-10-13
申请号:CN202210313693.4
申请日:2022-03-28
申请人: 中国移动通信有限公司研究院 , 清华大学 , 中国移动通信集团有限公司
摘要: 本发明提供一种图像处理方法、装置及设备,涉及通信技术领域。该方法包括:获取第一图像特征;根据所述第一图像特征进行第一卷积处理,得到第二图像特征;根据所述第一卷积处理中的每个子图像特征,确定对应的空间掩码;根据所述第一图像特征和所述空间掩码进行第二卷积处理,得到第三图像特征;根据所述第二图像特征和所述第三图像特征进行特征融合,得到目标图像特征。本发明的方案,解决了图像处理过程中资源浪费的问题。
-
-
-