-
公开(公告)号:CN115578246B
公开(公告)日:2023-08-04
申请号:CN202211335202.2
申请日:2022-10-28
Applicant: 电子科技大学
IPC: G06T3/00 , G06V10/44 , G06V10/82 , G06N3/0464 , G06N3/08
Abstract: 该发明公开了一种基于风格迁移的非对齐可见光和红外模态融合目标检测方法,属于多模态目标检测领域。本发明充分考虑可见光和红外图像不对齐的问题,采用一个可学习的仿射变换网络,对红外模态作仿射变换,实现模态间特征对齐,有效的提升模态融合的效果。本发明中采用一个可学习的仿射变换模块LATM(learning affine transform moduel)来进行特征对齐,采用一个风格迁移融合模块来进行模态间特征融合,本发明可以有效地应对非对齐的可见光和红外图像融合目标检测任务。
-
公开(公告)号:CN116310621A
公开(公告)日:2023-06-23
申请号:CN202211490992.1
申请日:2022-11-25
Applicant: 电子科技大学
IPC: G06V10/774 , G06V10/762 , G06V10/77 , G06V10/82 , G06N3/08 , G06N3/0464
Abstract: 本发明公开了一种基于特征库构建的少样本图像识别方法,属于图像分类领域;本发明能够在新类别训练样本数量及其不足的情况下完成该类别中的新类别物体的识别任务。首先是基于通道的主属性微调方法,只关注高响应的通道进行再训练。其次为了对新类图像信息进行补充,通过对已知类别图片进行特征提取并建立相应的特征库。最后对少数新类样本通过已知类别特征库进行多次局部特征替换,达到生成新类伪样本的效果,能够有效完成在少样本条件下对新类物体的识别任务。
-
公开(公告)号:CN116310484A
公开(公告)日:2023-06-23
申请号:CN202211587833.3
申请日:2022-12-11
Applicant: 电子科技大学
IPC: G06V10/764 , G06V10/82 , G06N3/045 , G06N3/0464 , G06N3/0442
Abstract: 本发明公开了一种基于双分支网络的连续学习的图像分类方法,属于图像处理技术领域。本发明包括:构建双分支网络,包含主分支、记忆分支;使用记忆分支学习第1批类别,并生成第1批类别的预测结果;从第2批开始,使用主分支学习第t批类别,更新记忆分支参数,生成第1批至第t批类别的预测结果;后续批次采用与步骤三相同的方法进行学习,直至学习完所有批次。本发明能有效避免学习新的类别时造成的旧类别遗忘以及有效克服类别不平衡造成的预测偏见现象,并且不额外增加模型参数量或网络结构。本发明有效提升了模型处理类增量数据的性能。
-
公开(公告)号:CN116228933A
公开(公告)日:2023-06-06
申请号:CN202310295814.1
申请日:2023-03-23
Applicant: 电子科技大学
Abstract: 本发明提供一种基于域适应的漫画视频生成方法,包括以下步骤:先使用人脸视频数据集对运动驱动网络进行训练;完成预训练的运动驱动网络对于输入的一张给定的源影像和驱动帧,就能根据驱动帧的运动生成并输出给定源影像的目标视频;再使用人脸视频数据集与漫画数据集对跨域网络进行训练;引入域判别器,利用梯度翻转层混淆人脸视频数据集和漫画数据集实现域分类误差的最大化。本发明首先使用人脸视频数据集进行图像动态化任务的训练,再将其使用域适应的方法适应到漫画域,解决了漫画数据集数量少而直接使用其进行训练容易导致的过拟合,泛化能力差等问题,不需要进行逐视频优化,使得生成视频的质量和稳定性得以保证。
-
公开(公告)号:CN114677515B
公开(公告)日:2023-05-26
申请号:CN202210442111.2
申请日:2022-04-25
Applicant: 电子科技大学
IPC: G06V10/26 , G06V10/764 , G06V10/762 , G06V10/82 , G06N3/0464 , G06N3/0895
Abstract: 本发明公开了一种基于类间相似性的弱监督语义分割方法,属于弱监督语义分割领域。本发明包括:基于每个类别的特征通过聚类方法将相似类进行合并得到新类,重新生成数据集中每个样本在新类上的标签;基于原始标签搭建分类网络,提取对应的类激活谱,将其与阈值比较获取判别性区域,从原图中擦除判别性区域,将其送入基于新标签建立的分类网络,完成对抗擦除模型的搭建;基于训练好的对抗擦除模型,提取类激活谱,依次经过类激活谱增强模块和融合模块的处理,得到最终的类激活谱,再将其与前景背景阈值比较得到伪标注,基于该伪标注对语义分割模型进行训练,得到训练好的分割模型。本发明提升了图像的弱监督语义分割的分割准确。
-
公开(公告)号:CN114494284B
公开(公告)日:2023-04-18
申请号:CN202111635864.7
申请日:2021-12-29
Applicant: 电子科技大学
IPC: G06T7/11 , G06T5/50 , G06V10/764 , G06V10/82 , G06N3/0464 , G06N3/048 , G06N3/08
Abstract: 本发明的目的在于提供一种基于显式监督区域关系的场景解析模型及方法,属于计算机视觉中的图像分割技术领域。本发明所公开的场景解析模型通过对场景图片中的区域内和区域间关系分别建模,并在网络训练过程中给予两种区域关系对应的显式监督信息,使得区域内关系模块利用了更准确的区域内类别先验信息,提高了困难类别的判别能力;通过区域间关系模块捕捉了更准确的区域间类别相互关系,提高了相似类别的分辨能力,具有解析准确率高、额外计算复杂度低等特点。
-
公开(公告)号:CN110619356B
公开(公告)日:2023-03-28
申请号:CN201910802929.9
申请日:2019-08-28
Applicant: 电子科技大学
IPC: G06F18/241 , G06N3/0464
Abstract: 本发明提供一种基于区域建议注意力的目标检测方法,针对RefineDet特征判别力不足的问题,将ARM生成的有无目标的分类结果特征谱作为区域建议注意力与ODM的多分类特征谱通过点乘的方式进行融合,在优化后的多分类特征谱中突出目标区域的显著性。本发明优化了多分类特征谱的判别力,提升了后续进行的RefineDet目标检测的分类效果,从而有效减少误检、漏检情况,提升目标检测的准确率。相比于现有RefineDet算法,能够在不增加参数的基础上,有效地提升目标检测的分类精度。
-
公开(公告)号:CN110610145B
公开(公告)日:2022-11-08
申请号:CN201910802207.3
申请日:2019-08-28
Applicant: 电子科技大学
Abstract: 本发明提供一种结合全局运动参数的行为识别方法。由于智能设备是戴在头部的,所以随着头部的运动会产生全局运动信息,这对于行为识别会产生很大的干扰,将原始行为视频的特征与全局运动信息特征进行融合,能减少全局运动信息的影响。本发明不增加智能设备的成本,只稍微增加网络运行时间,计算复杂度低,将全局运动信息融入行为识别网络,为行为识别网络提供全局信息,减少头部抖动以及一些全局信息的干扰,使得预测准确率更高,而且全局运动参数的提取相对于光流的提取极大的降低了时间成本。
-
公开(公告)号:CN112685590B
公开(公告)日:2022-10-14
申请号:CN202011597827.7
申请日:2020-12-29
Applicant: 电子科技大学
IPC: G06F16/583 , G06F16/538 , G06N3/04
Abstract: 本发明提出一种基于卷积神经网络正则化处理的图像检索方法,利用基于结构拓展的卷积神经网络正则化处理,将神经网络结构用有向无环图的形式来表示,再对有向无环图的结构进行一系列拓展,然后训练拓展后所得图所对应的神经网络,最后将神经网络中除原始结构以外的层删除。相比现有技术,本发明所提方法在不增加推理代价的情况下,提升了神经网络的性能,在计算机视觉的各大方向均有应用前景。
-
公开(公告)号:CN110956671B
公开(公告)日:2022-08-02
申请号:CN201911290877.8
申请日:2019-12-12
Applicant: 电子科技大学
Abstract: 本发明公开了一种基于多尺度特征编码的图像压缩方法,通过训练集图像特征的梯度谱绝对值取平均得到选择向量,并利用选择向量来指导不同通道特征选择编码分辨率;同时将低分辨率编码的特征在解码端经过超分辨网络进行恢复,最终与高分辨率编码的特征重新组合成完整特征谱,映射回原始图像。本发明针对图像特征的特点进行差异性处理,对于容易从上下文信息恢复的特征用低分辨率传输,从而节省了码率;对于复杂的精细特征用高分辨率传输,减小了损失程度。
-
-
-
-
-
-
-
-
-