一种模型训练、图像识别方法、装置、设备及存储介质

    公开(公告)号:CN116091867B

    公开(公告)日:2023-09-29

    申请号:CN202310063908.6

    申请日:2023-01-12

    IPC分类号: G06V10/774 G06V10/764

    摘要: 本申请提供了一种模型训练、图像识别方法、装置、设备及存储介质,所述方法包括:在源域数据集中随机获取多个图像插曲;构建任务感知的自适应学习网络模型;将所述图像插曲输入所述自适应学习网络模型,得到所述图像插曲中的支持样本与查询样本的特征图;根据所述支持样本与所述查询样本的特征图确定分类损失,根据所述图像插曲与目标域数据集的域偏移确定自适应损失,根据所述分类损失与所述自适应损失确定整体损失;根据所述整体损失调整所述自适应学习网络模型,直至所述整体损失收敛为止。本申请中,通过将域偏移引入损失函数,从而使得训练后的模型可以兼顾具备不同域偏移的目标数据集,达到更准确的图像识别效果。

    一种基于跨数据集信息挖掘的细粒度图像识别方法与装置

    公开(公告)号:CN116563607A

    公开(公告)日:2023-08-08

    申请号:CN202310382101.9

    申请日:2023-04-11

    摘要: 本申请涉及一种基于跨数据集信息挖掘的细粒度图像识别方法与装置。所述方法包括:获取目标细粒度图像;将目标细粒度图像输入训练好的细粒度图像识别神经网络,其中,细粒度图像识别神经网络包括特征提取模块、空间注意力模块、特征去相关模块、特征汇聚模块、识别模块,特征提取模块、空间注意力模块、特征去相关模块、特征汇聚模块、识别模块均为基于跨数据集信息预先训练的;训练好的细粒度图像识别神经网络输出与目标细粒度图像对应的识别结果。本申请通过基于跨数据集信息预先训练的细粒度图像识别神经网络对目标细粒度图像进行识别,因为训练过程学习到了不同数据集之间的正负迁移,也平衡了跨数据集的正负迁移,从而提升了识别精准度。

    低资源的音频字幕生成方法、装置、电子设备及介质

    公开(公告)号:CN117809654A

    公开(公告)日:2024-04-02

    申请号:CN202311593526.0

    申请日:2023-11-27

    IPC分类号: G10L15/26 G10L19/16 G10L15/06

    摘要: 本申请公开了一种低资源的音频字幕生成方法、装置、电子设备及介质。通过应用本申请的技术方案,可以在一个包含语言编码器与音频编码器的多模态预训练模型中,首先利用样本量比较充足的文本数据,为已有的语言编码器训练得到一个语言解码器。并在后续将该语言编码器替换为音频编码器,以达到间接为音频编码器训练得到语言解码器的目的。以使后续仅用样本量较少的音频配对数据也能训练得到一个精度较高的音频多模态预训练模型。从而实现了一种在仅有少量可供训练音频‑字幕数据对的情况下,仍能取得较高模型性能的技术方案。

    音频信号内容分析方法、装置、设备及存储介质

    公开(公告)号:CN117594060A

    公开(公告)日:2024-02-23

    申请号:CN202311435217.0

    申请日:2023-10-31

    摘要: 本申请提出一种音频信号内容分析方法、设备及存储介质,该方法包括:获取待处理的目标音频信号的目标音频特征;基于目标嵌入特征和目标音频特征,确定当前时间步的特征概率分布,目标嵌入特征为前一时间步的描述词的原始词嵌入特征或者目标音频信号的预设词嵌入特征;基于特征概率分布从特征概率分布的多个潜在特征中选取当前时间步的目标潜在特征;基于多个时间步的目标词潜在特征和目标音频特征,生成目标音频信号对应的目标描述信息。本申请实施例实现了可以基于音频信号生成不同的描述信息。

    小样本图像识别方法、装置、设备及存储介质

    公开(公告)号:CN115424053B

    公开(公告)日:2023-05-02

    申请号:CN202210879098.7

    申请日:2022-07-25

    摘要: 本申请公开了一种小样本图像识别方法、装置、设备及存储介质,所述方法包括:获取待识别的图像,根据所述待识别的图像构建图像插曲,所述图像插曲中包含支持集和查询集;将所述图像插曲输入预训练的图像识别模型,所述图像识别模型为基于困难插曲训练的小样本图像识别模型;根据所述图像识别模型计算所述查询集中的图像与支持集中的图像类别的相似度,根据所述相似度确定待识别的查询集中的图像类别。本申请实施例提供的图像识别方法,能够利用较少的图像样本进行模型训练和图像识别,且将困难插曲融入小样本图像识别模型训练过程中,使小样本图像识别模型能够更加高效快速的进行训练,且训练好的模型稳定性更高,图像识别的准确率也更高。

    多视角的细粒度识别方法、装置、电子设备及介质

    公开(公告)号:CN115424086A

    公开(公告)日:2022-12-02

    申请号:CN202210887082.0

    申请日:2022-07-26

    摘要: 本申请公开了一种多视角的细粒度识别方法、装置、电子设备及介质。通过应用本申请的技术方案,可以利用一个由多个多视图样本的多视角图像所组成的样本数据集来对初始分类模型进行训练。从而得到一个能够主动选择同一样本的下一个视图图像进行图像识别的高效细粒度识别模型,进而一方面通过对同一样本多视图图像的信息聚合,解决了传统细粒度图像识别方法仅依靠单一图片提供具有判别力线索的局限性。另一方面通过对具有判别力视图的预测,提高了基于多视图细粒度识别的识别效率。

    一种基于跨数据集信息挖掘的细粒度图像识别方法与装置

    公开(公告)号:CN116563607B

    公开(公告)日:2024-09-17

    申请号:CN202310382101.9

    申请日:2023-04-11

    摘要: 本申请涉及一种基于跨数据集信息挖掘的细粒度图像识别方法与装置。所述方法包括:获取目标细粒度图像;将目标细粒度图像输入训练好的细粒度图像识别神经网络,其中,细粒度图像识别神经网络包括特征提取模块、空间注意力模块、特征去相关模块、特征汇聚模块、识别模块,特征提取模块、空间注意力模块、特征去相关模块、特征汇聚模块、识别模块均为基于跨数据集信息预先训练的;训练好的细粒度图像识别神经网络输出与目标细粒度图像对应的识别结果。本申请通过基于跨数据集信息预先训练的细粒度图像识别神经网络对目标细粒度图像进行识别,因为训练过程学习到了不同数据集之间的正负迁移,也平衡了跨数据集的正负迁移,从而提升了识别精准度。

    基于跨层特征挖掘的图像识别方法、装置及电子设备

    公开(公告)号:CN117911755A

    公开(公告)日:2024-04-19

    申请号:CN202311836043.9

    申请日:2023-12-28

    摘要: 本申请涉及深度学习及计算机视觉识别技术领域,尤其涉及基于跨层特征挖掘的图像识别方法、装置及电子设备。所述方法包括:获取待识别图像,并提取所述待识别图像的全局特征图;对所述待识别图像的全局特征图进行降维映射,得到所述待识别图像不同层次的特征向量;根据所述待识别图像的不同层次特征图构建特征矩阵;基于所述特征矩阵和所述不同层次的特征向量进行多头注意力机制的加权融合操作,以得到跨层特征挖掘后的特征向量;基于所述跨层特征挖掘后的特征向量识别所述待识别图像。本申请通过跨层特征的挖掘实现了图像特征的增强,通过对多粒度的理解,使图像识别取得全面且足够精细的识别效果。

    图像特征的识别方法、装置、电子设备及介质

    公开(公告)号:CN116824151A

    公开(公告)日:2023-09-29

    申请号:CN202310513085.2

    申请日:2023-05-08

    摘要: 本申请公开了一种图像特征的识别方法、装置、电子设备及介质。通过应用本申请的技术方案,可以将对图像进行首次解耦得到的初始解耦特征进行洗牌后重组拼接为新的合成特征,进而在该合成特征的基础上再次进行解耦处理,以得到一种能够移去原图像中存在的,属性和物体间可能存在的虚假相关性的重组解耦特征。从而实现根据该重组解耦特征得到图像相关识别结果的目的。避免了相关技术中出现的,模型只偏向于能够识别在训练期间可见的物体属性组合,而无法准确识别训练期间不可见的物体属性组合的问题。