-
公开(公告)号:CN111860672B
公开(公告)日:2021-03-16
申请号:CN202010738474.1
申请日:2020-07-28
申请人: 北京邮电大学
摘要: 一种基于分块卷积神经网络的细粒度图像分类方法,涉及细粒度图像识别技术领域,解决现有方法将原始图像平均分块后输入到卷积神经网络中用于细粒度图像分类,存在感受野限制较弱的问题,本发明不引入额外的参数与运算,在预测过程中保留通用卷积神经网络的高效性,不需要过大的感受野的特性将输入特征图进行分块,每块分别进行卷积操作后,再重新拼接,具有较强的限制性。本发明将卷积的感受野按需要进行限制,使网络更加关注局部区域的特征,更适合应用于细粒度图像分类任务。本发明所述的细粒度图像分类方法,在不引入更多参数的前提下,限制卷积层的感受野范围,使卷积神经网络能够寻找较小的有判别力的局部区域。
-
公开(公告)号:CN116563607B
公开(公告)日:2024-09-17
申请号:CN202310382101.9
申请日:2023-04-11
申请人: 北京邮电大学
IPC分类号: G06V10/764 , G06V10/82 , G06N3/0464 , G06N3/048 , G06N3/08
摘要: 本申请涉及一种基于跨数据集信息挖掘的细粒度图像识别方法与装置。所述方法包括:获取目标细粒度图像;将目标细粒度图像输入训练好的细粒度图像识别神经网络,其中,细粒度图像识别神经网络包括特征提取模块、空间注意力模块、特征去相关模块、特征汇聚模块、识别模块,特征提取模块、空间注意力模块、特征去相关模块、特征汇聚模块、识别模块均为基于跨数据集信息预先训练的;训练好的细粒度图像识别神经网络输出与目标细粒度图像对应的识别结果。本申请通过基于跨数据集信息预先训练的细粒度图像识别神经网络对目标细粒度图像进行识别,因为训练过程学习到了不同数据集之间的正负迁移,也平衡了跨数据集的正负迁移,从而提升了识别精准度。
-
公开(公告)号:CN117911755A
公开(公告)日:2024-04-19
申请号:CN202311836043.9
申请日:2023-12-28
申请人: 北京邮电大学
IPC分类号: G06V10/764 , G06V10/42 , G06V10/44 , G06V10/77 , G06V10/80
摘要: 本申请涉及深度学习及计算机视觉识别技术领域,尤其涉及基于跨层特征挖掘的图像识别方法、装置及电子设备。所述方法包括:获取待识别图像,并提取所述待识别图像的全局特征图;对所述待识别图像的全局特征图进行降维映射,得到所述待识别图像不同层次的特征向量;根据所述待识别图像的不同层次特征图构建特征矩阵;基于所述特征矩阵和所述不同层次的特征向量进行多头注意力机制的加权融合操作,以得到跨层特征挖掘后的特征向量;基于所述跨层特征挖掘后的特征向量识别所述待识别图像。本申请通过跨层特征的挖掘实现了图像特征的增强,通过对多粒度的理解,使图像识别取得全面且足够精细的识别效果。
-
公开(公告)号:CN116824151A
公开(公告)日:2023-09-29
申请号:CN202310513085.2
申请日:2023-05-08
申请人: 北京邮电大学
IPC分类号: G06V10/40 , G06V10/764 , G06V10/774 , G06V10/82 , G06N3/0455
摘要: 本申请公开了一种图像特征的识别方法、装置、电子设备及介质。通过应用本申请的技术方案,可以将对图像进行首次解耦得到的初始解耦特征进行洗牌后重组拼接为新的合成特征,进而在该合成特征的基础上再次进行解耦处理,以得到一种能够移去原图像中存在的,属性和物体间可能存在的虚假相关性的重组解耦特征。从而实现根据该重组解耦特征得到图像相关识别结果的目的。避免了相关技术中出现的,模型只偏向于能够识别在训练期间可见的物体属性组合,而无法准确识别训练期间不可见的物体属性组合的问题。
-
公开(公告)号:CN115952255A
公开(公告)日:2023-04-11
申请号:CN202211457156.3
申请日:2022-11-21
申请人: 北京邮电大学
IPC分类号: G06F16/33 , G06F16/35 , G06F40/289 , G06F16/683 , G06F16/783 , G06F18/22 , G06F18/241 , G06F18/2415 , G06N3/0464 , G06N3/047 , G06N3/08
摘要: 本申请公开了一种多模态信号内容分析方法、装置、电子设备及存储介质。该多模态信号内容分析方法包括:获取音频‑视频信号对应的字幕词嵌入特征;利用预训练的字幕代理特征提取模型处理所述字幕词嵌入特征,得到字幕代理特征;基于所述字幕代理特征生成字幕。本申请实施例提供的多模态信号内容分析方法,利用预训练的字幕代理特征提取模型处理所述字幕词嵌入特征,得到字幕代理特征,基于字幕代理特征生成字幕,避免了由于字幕语义差异性对训练的影响,生成的字幕能够更好地描述音频‑视频信号的内容,克服了相关技术中没有考虑字幕差异性对音频‑视频字幕任务的影响所导致的不良影响。
-
公开(公告)号:CN116824151B
公开(公告)日:2024-04-16
申请号:CN202310513085.2
申请日:2023-05-08
申请人: 北京邮电大学
IPC分类号: G06V10/40 , G06V10/764 , G06V10/774 , G06V10/82 , G06N3/0455
摘要: 本申请公开了一种图像特征的识别方法、装置、电子设备及介质。通过应用本申请的技术方案,可以将对图像进行首次解耦得到的初始解耦特征进行洗牌后重组拼接为新的合成特征,进而在该合成特征的基础上再次进行解耦处理,以得到一种能够移去原图像中存在的,属性和物体间可能存在的虚假相关性的重组解耦特征。从而实现根据该重组解耦特征得到图像相关识别结果的目的。避免了相关技术中出现的,模型只偏向于能够识别在训练期间可见的物体属性组合,而无法准确识别训练期间不可见的物体属性组合的问题。
-
公开(公告)号:CN115439845A
公开(公告)日:2022-12-06
申请号:CN202210922254.3
申请日:2022-08-02
申请人: 北京邮电大学
摘要: 本申请涉及一种基于图神经网络的图像外推方法、装置、存储介质及终端。其中,所述方法包括:获取图像外推的原始图像;根据所述原始图像和目标检测器,确定所述图像外推的无向场景图;根据所述无向场景图和图神经网络,推测所述图像外推的外推场景图;根据所述外推场景图、所述原始图像和生成对抗网络,生成所述图像外推的外推图像。本申请能够根据原始图像生成外推图像,且生成的外推图像更具真实性。
-
公开(公告)号:CN115424053A
公开(公告)日:2022-12-02
申请号:CN202210879098.7
申请日:2022-07-25
申请人: 北京邮电大学
IPC分类号: G06V10/764 , G06V10/774 , G06V10/82 , G06N3/08
摘要: 本申请公开了一种小样本图像识别方法、装置、设备及存储介质,所述方法包括:获取待识别的图像,根据所述待识别的图像构建图像插曲,所述图像插曲中包含支持集和查询集;将所述图像插曲输入预训练的图像识别模型,所述图像识别模型为基于困难插曲训练的小样本图像识别模型;根据所述图像识别模型计算所述查询集中的图像与支持集中的图像类别的相似度,根据所述相似度确定待识别的查询集中的图像类别。本申请实施例提供的图像识别方法,能够利用较少的图像样本进行模型训练和图像识别,且将困难插曲融入小样本图像识别模型训练过程中,使小样本图像识别模型能够更加高效快速的进行训练,且训练好的模型稳定性更高,图像识别的准确率也更高。
-
公开(公告)号:CN111860672A
公开(公告)日:2020-10-30
申请号:CN202010738474.1
申请日:2020-07-28
申请人: 北京邮电大学
摘要: 一种基于分块卷积神经网络的细粒度图像分类方法,涉及细粒度图像识别技术领域,解决现有方法将原始图像平均分块后输入到卷积神经网络中用于细粒度图像分类,存在感受野限制较弱的问题,本发明不引入额外的参数与运算,在预测过程中保留通用卷积神经网络的高效性,不需要过大的感受野的特性将输入特征图进行分块,每块分别进行卷积操作后,再重新拼接,具有较强的限制性。本发明将卷积的感受野按需要进行限制,使网络更加关注局部区域的特征,更适合应用于细粒度图像分类任务。本发明所述的细粒度图像分类方法,在不引入更多参数的前提下,限制卷积层的感受野范围,使卷积神经网络能够寻找较小的有判别力的局部区域。
-
-
-
-
-
-
-
-