一种基于视觉语言模型的生成式图像无监督检测方法

    公开(公告)号:CN118552756B

    公开(公告)日:2025-04-18

    申请号:CN202410332649.7

    申请日:2024-03-22

    Abstract: 本发明公开了一种基于视觉语言模型的生成式图像无监督检测方法,包括如下步骤:获取图像数据集;通过噪声指纹提取、频域特征提取和聚类算法,为未标记数据有效分配噪声标签,并利用预训练的视觉语言模型和对比学习策略,建立了一个高效的特征提取器;使用训练好的特征提取器提取待测试样本的高维度判别特征,并通过聚类算法将得到的判别特征归为两个聚类簇,通过计算余弦相似度判别真实图像和生成图像。该方法通过无监督学习,自始至终都不需要使用标记数据,克服了有监督学习依赖正确标记的大规模数据的问题。并通过预训练的视觉语言模型提升检测器的泛化性和鲁棒性。在检测不同生成模型生成的图像时展现了一定的泛化能力。

    一种基于视觉语言模型的生成式图像无监督检测方法

    公开(公告)号:CN118552756A

    公开(公告)日:2024-08-27

    申请号:CN202410332649.7

    申请日:2024-03-22

    Abstract: 本发明公开了一种基于视觉语言模型的生成式图像无监督检测方法,包括如下步骤:获取图像数据集;通过噪声指纹提取、频域特征提取和聚类算法,为未标记数据有效分配噪声标签,并利用预训练的视觉语言模型和对比学习策略,建立了一个高效的特征提取器;使用训练好的特征提取器提取待测试样本的高维度判别特征,并通过聚类算法将得到的判别特征归为两个聚类簇,通过计算余弦相似度判别真实图像和生成图像。该方法通过无监督学习,自始至终都不需要使用标记数据,克服了有监督学习依赖正确标记的大规模数据的问题。并通过预训练的视觉语言模型提升检测器的泛化性和鲁棒性。在检测不同生成模型生成的图像时展现了一定的泛化能力。

    一种基于多感受野的轻量化条带钢表面缺陷预测方法

    公开(公告)号:CN117593289A

    公开(公告)日:2024-02-23

    申请号:CN202311789717.4

    申请日:2023-12-25

    Abstract: 本发明公开了一种基于卷积神经网络的条带钢表面缺陷检测方法,包括如下步骤:步骤1、构建一个LSDD模型,所述LSDD模型包括编码器和解码器,所述编码器由5个MHL模块构成;所述解码器由5个LEF模块构成;步骤2、应用公开数据集对LSDD模型进行训练;步骤3、将图像数据作为输入,通过完成训练的LSDD模型进行预测。该方法能在保持轻量化(参数少、运算速率快)的前提上,更大程度还原条带钢表面的缺陷信息。

    基于双分支架构网络的遥感图像显著性检测方法

    公开(公告)号:CN117333770A

    公开(公告)日:2024-01-02

    申请号:CN202311296212.4

    申请日:2023-10-09

    Abstract: 本发明公开了一种基于双分支架构的遥感图像显著性检测方法,包括如下步骤:收集遥感图像数据集和扩增;通过主干网络进行特征提取;对于步骤2中的Swin‑Transformer主干网络获取的初始特征通过通道注意力进行特征增强,而对于VGG16主干网络获取的初始特征通过空间注意力进行特征增强,然后将输出的两个增强特征在通道维度上进行初步融合;对于上述得到的初步融合特征利用图结构的表示能力,建立图上每个像素和每个通道之间的语义关系,得到若干层级的编码特征;对编码特征进行解码生成解码特征;得到最终预测图结果。该方法针对遥感图像数据集自身的特点进行设计,引入并行分支编码器分别尝试使用Transformer和CNNs来提取全局上下文信息和局部细节特征。

Patent Agency Ranking