基于类间相似性的弱监督语义分割方法

    公开(公告)号:CN114677515B

    公开(公告)日:2023-05-26

    申请号:CN202210442111.2

    申请日:2022-04-25

    Abstract: 本发明公开了一种基于类间相似性的弱监督语义分割方法,属于弱监督语义分割领域。本发明包括:基于每个类别的特征通过聚类方法将相似类进行合并得到新类,重新生成数据集中每个样本在新类上的标签;基于原始标签搭建分类网络,提取对应的类激活谱,将其与阈值比较获取判别性区域,从原图中擦除判别性区域,将其送入基于新标签建立的分类网络,完成对抗擦除模型的搭建;基于训练好的对抗擦除模型,提取类激活谱,依次经过类激活谱增强模块和融合模块的处理,得到最终的类激活谱,再将其与前景背景阈值比较得到伪标注,基于该伪标注对语义分割模型进行训练,得到训练好的分割模型。本发明提升了图像的弱监督语义分割的分割准确。

    一种基于多尺度特征编码的图像压缩方法

    公开(公告)号:CN110956671B

    公开(公告)日:2022-08-02

    申请号:CN201911290877.8

    申请日:2019-12-12

    Abstract: 本发明公开了一种基于多尺度特征编码的图像压缩方法,通过训练集图像特征的梯度谱绝对值取平均得到选择向量,并利用选择向量来指导不同通道特征选择编码分辨率;同时将低分辨率编码的特征在解码端经过超分辨网络进行恢复,最终与高分辨率编码的特征重新组合成完整特征谱,映射回原始图像。本发明针对图像特征的特点进行差异性处理,对于容易从上下文信息恢复的特征用低分辨率传输,从而节省了码率;对于复杂的精细特征用高分辨率传输,减小了损失程度。

    基于部件模板的室内人物检测方法

    公开(公告)号:CN110309792B

    公开(公告)日:2022-07-01

    申请号:CN201910599633.1

    申请日:2019-07-04

    Abstract: 本发明公开了基于部件模板的室内人物检测方法,属于目标检测领域和深度学习领域,首先收集数据集,再对数据集进行特征提取和构建特征金字塔,基于部件模板的子区域得到每个候选框的前景置信分数,并通过池化和全连接层得到定位框位置,完成检测模型的搭建;然后根据数据集的图片采用Xavier方法对检测模型进行初始化,基于检测模型的损失函数进行迭代到预设迭代次数,完成检测模型的训练,最后使用新的图片进行推理测试,得到检测结果。本发明解决了目前通用的目标检测方法在对室内场景的人物检测方面定位和识别的准确率较低的问题。

    一种基于动态自注意力生成对抗网络的图像合成方法

    公开(公告)号:CN113379655A

    公开(公告)日:2021-09-10

    申请号:CN202110537516.X

    申请日:2021-05-18

    Abstract: 本发明公开了一种基于动态自注意力生成对抗网络的图像合成方法,属于计算机视觉领域。该方法首先选择生成对抗网络作为基本框架,并对训练图片进行归一化,还对正态分布进行采样得到噪声样本。本发明借鉴了Linformer算法和动态卷积算法,并对发明中使用的多头自注意力机制进行改进,增加了每个自注意力头之间的联系和约束,使得这些自注意力头可以去学习到图像的各种模式知识。本发明充分地发挥了动态自注意力机制和生成对抗网络的优势,提出的动态自注意力模块可大幅度降低多头自注意力机制的计算复杂度,并改善生成对抗网络的模式崩塌和训练不稳定等问题。

    一种基于多尺度语言嵌入REC的目标检测方法

    公开(公告)号:CN112926662A

    公开(公告)日:2021-06-08

    申请号:CN202110222614.4

    申请日:2021-02-25

    Abstract: 本发明提供一种基于多尺度语言嵌入REC的目标检测方法,把语言特征转化为不同尺度的卷积核,并与视觉特征进行卷积,得到语言特征与视觉特征每个点及其周围的点的相似度,将得到的相似度谱作用回原始视觉特征上,加强与语言相关的视觉特征的表达,同时引入全局视觉语言相互作用信息及位置信息,预测被描述的目标的位置,提升了网络对于视觉上下文的利用能力,相比于基准的普通基于单阶段REC的目标检测方法,预测准确率更高。

Patent Agency Ranking