一种基于特征库构建的少样本图像识别方法

    公开(公告)号:CN116310621A

    公开(公告)日:2023-06-23

    申请号:CN202211490992.1

    申请日:2022-11-25

    Abstract: 本发明公开了一种基于特征库构建的少样本图像识别方法,属于图像分类领域;本发明能够在新类别训练样本数量及其不足的情况下完成该类别中的新类别物体的识别任务。首先是基于通道的主属性微调方法,只关注高响应的通道进行再训练。其次为了对新类图像信息进行补充,通过对已知类别图片进行特征提取并建立相应的特征库。最后对少数新类样本通过已知类别特征库进行多次局部特征替换,达到生成新类伪样本的效果,能够有效完成在少样本条件下对新类物体的识别任务。

    基于双分支网络的连续学习的图像分类方法

    公开(公告)号:CN116310484A

    公开(公告)日:2023-06-23

    申请号:CN202211587833.3

    申请日:2022-12-11

    Abstract: 本发明公开了一种基于双分支网络的连续学习的图像分类方法,属于图像处理技术领域。本发明包括:构建双分支网络,包含主分支、记忆分支;使用记忆分支学习第1批类别,并生成第1批类别的预测结果;从第2批开始,使用主分支学习第t批类别,更新记忆分支参数,生成第1批至第t批类别的预测结果;后续批次采用与步骤三相同的方法进行学习,直至学习完所有批次。本发明能有效避免学习新的类别时造成的旧类别遗忘以及有效克服类别不平衡造成的预测偏见现象,并且不额外增加模型参数量或网络结构。本发明有效提升了模型处理类增量数据的性能。

    一种基于域适应的漫画视频生成方法

    公开(公告)号:CN116228933A

    公开(公告)日:2023-06-06

    申请号:CN202310295814.1

    申请日:2023-03-23

    Abstract: 本发明提供一种基于域适应的漫画视频生成方法,包括以下步骤:先使用人脸视频数据集对运动驱动网络进行训练;完成预训练的运动驱动网络对于输入的一张给定的源影像和驱动帧,就能根据驱动帧的运动生成并输出给定源影像的目标视频;再使用人脸视频数据集与漫画数据集对跨域网络进行训练;引入域判别器,利用梯度翻转层混淆人脸视频数据集和漫画数据集实现域分类误差的最大化。本发明首先使用人脸视频数据集进行图像动态化任务的训练,再将其使用域适应的方法适应到漫画域,解决了漫画数据集数量少而直接使用其进行训练容易导致的过拟合,泛化能力差等问题,不需要进行逐视频优化,使得生成视频的质量和稳定性得以保证。

    基于类间相似性的弱监督语义分割方法

    公开(公告)号:CN114677515B

    公开(公告)日:2023-05-26

    申请号:CN202210442111.2

    申请日:2022-04-25

    Abstract: 本发明公开了一种基于类间相似性的弱监督语义分割方法,属于弱监督语义分割领域。本发明包括:基于每个类别的特征通过聚类方法将相似类进行合并得到新类,重新生成数据集中每个样本在新类上的标签;基于原始标签搭建分类网络,提取对应的类激活谱,将其与阈值比较获取判别性区域,从原图中擦除判别性区域,将其送入基于新标签建立的分类网络,完成对抗擦除模型的搭建;基于训练好的对抗擦除模型,提取类激活谱,依次经过类激活谱增强模块和融合模块的处理,得到最终的类激活谱,再将其与前景背景阈值比较得到伪标注,基于该伪标注对语义分割模型进行训练,得到训练好的分割模型。本发明提升了图像的弱监督语义分割的分割准确。

    基于区域建议注意力的目标检测方法

    公开(公告)号:CN110619356B

    公开(公告)日:2023-03-28

    申请号:CN201910802929.9

    申请日:2019-08-28

    Abstract: 本发明提供一种基于区域建议注意力的目标检测方法,针对RefineDet特征判别力不足的问题,将ARM生成的有无目标的分类结果特征谱作为区域建议注意力与ODM的多分类特征谱通过点乘的方式进行融合,在优化后的多分类特征谱中突出目标区域的显著性。本发明优化了多分类特征谱的判别力,提升了后续进行的RefineDet目标检测的分类效果,从而有效减少误检、漏检情况,提升目标检测的准确率。相比于现有RefineDet算法,能够在不增加参数的基础上,有效地提升目标检测的分类精度。

    一种结合全局运动参数的行为识别方法

    公开(公告)号:CN110610145B

    公开(公告)日:2022-11-08

    申请号:CN201910802207.3

    申请日:2019-08-28

    Abstract: 本发明提供一种结合全局运动参数的行为识别方法。由于智能设备是戴在头部的,所以随着头部的运动会产生全局运动信息,这对于行为识别会产生很大的干扰,将原始行为视频的特征与全局运动信息特征进行融合,能减少全局运动信息的影响。本发明不增加智能设备的成本,只稍微增加网络运行时间,计算复杂度低,将全局运动信息融入行为识别网络,为行为识别网络提供全局信息,减少头部抖动以及一些全局信息的干扰,使得预测准确率更高,而且全局运动参数的提取相对于光流的提取极大的降低了时间成本。

    一种基于卷积神经网络正则化处理的图像检索方法

    公开(公告)号:CN112685590B

    公开(公告)日:2022-10-14

    申请号:CN202011597827.7

    申请日:2020-12-29

    Abstract: 本发明提出一种基于卷积神经网络正则化处理的图像检索方法,利用基于结构拓展的卷积神经网络正则化处理,将神经网络结构用有向无环图的形式来表示,再对有向无环图的结构进行一系列拓展,然后训练拓展后所得图所对应的神经网络,最后将神经网络中除原始结构以外的层删除。相比现有技术,本发明所提方法在不增加推理代价的情况下,提升了神经网络的性能,在计算机视觉的各大方向均有应用前景。

    一种基于多尺度特征编码的图像压缩方法

    公开(公告)号:CN110956671B

    公开(公告)日:2022-08-02

    申请号:CN201911290877.8

    申请日:2019-12-12

    Abstract: 本发明公开了一种基于多尺度特征编码的图像压缩方法,通过训练集图像特征的梯度谱绝对值取平均得到选择向量,并利用选择向量来指导不同通道特征选择编码分辨率;同时将低分辨率编码的特征在解码端经过超分辨网络进行恢复,最终与高分辨率编码的特征重新组合成完整特征谱,映射回原始图像。本发明针对图像特征的特点进行差异性处理,对于容易从上下文信息恢复的特征用低分辨率传输,从而节省了码率;对于复杂的精细特征用高分辨率传输,减小了损失程度。

Patent Agency Ranking