一种基于增强多模态对齐的广义零样本图像分类方法

    公开(公告)号:CN113139591A

    公开(公告)日:2021-07-20

    申请号:CN202110401006.X

    申请日:2021-04-14

    Applicant: 广州大学

    Abstract: 本发明公开了一种基于增强多模态对齐的广义零样本图像分类方法,该方法包括以下步骤:图像获取步骤:获取待识别图像;图像分类步骤:将待识别图像输入广义零样本图像分类模型中确定待识别图像的识别目标类别;广义零样本图像分类模型为通过训练步骤和测试步骤得出;训练步骤具体包括:特征编码步骤:采用两个超球面变分自编码器分别对训练样本的视觉特征和语义特征编码进共享的潜层空间中;潜层向量对齐步骤:将训练模型的优化方向趋向于视觉潜层向量和语义潜层向量的分布对齐;分布边界阈值获取步骤:寻找分布边界阈值。本发明通过超球面变分自编码器为视觉特征和语义特征构建潜层空间,使不同类的相互远离,提高已见类和未见类的识别效果。

    一种基于边沿检测的伪装目标检测方法

    公开(公告)号:CN113139450A

    公开(公告)日:2021-07-20

    申请号:CN202110409358.X

    申请日:2021-04-16

    Applicant: 广州大学

    Abstract: 本发明公开了一种基于边沿检测的伪装目标检测方法,包括:将待检测伪装图像进行分层标注,将分层标注后的待检测伪装图像输入构建并已训练好的伪装目标检测网络模型,伪装目标检测网络模型完成伪装目标的检测;其中伪装目标检测网络模型包括主干网络、RF模块、EF模块、SA模块以及PDC模块;主干网络提取待检测的伪装图像的多尺度特征图,并对多尺度特征图采用稠密连接策略来保存不同特征层的信息;稠密连接的多尺度特征输入RF模块,利用RF模块扩大感受野;本发由于额外增强边沿特征的思想,能够进一步突出伪装的显著性目标并且细化边沿特征,这有利于提高伪装目标检测的能力,拓展了本发明的使用场景。

    一种利用时频域层级处理的低光照图像增强方法

    公开(公告)号:CN114219722A

    公开(公告)日:2022-03-22

    申请号:CN202111336761.0

    申请日:2021-11-12

    Applicant: 广州大学

    Abstract: 本发明涉及一种利用时频域层级处理的低光照图像增强方法,包括步骤:S1、构建低光照图像数据集,包括低光照图像数据集的采集和标注,合理划分训练数据集和测试数据集;S2、建立低光照图像增强网络框架,使用深度学习中的卷积神经网络搭建整个网络框架;S3、进行模型训练,利用步骤S1划分好的训练数据集对步骤S2构建的低光照图像增强网络框架进行迭代训练;S4、进行模型测试,利用步骤S3训练后保存的模型对步骤S1划分好的测试数据集进行检测。本发明在深度学习框架下,结合时域与频域构建网络框架,利用数据驱动方式对低光照图像进行层级处理,实现图像亮度拉伸,生成清晰、低噪声的结果图像,使得低光照图像增强任务更高效。

    一种利用时频域层级处理的低光照图像增强方法

    公开(公告)号:CN114219722B

    公开(公告)日:2024-11-19

    申请号:CN202111336761.0

    申请日:2021-11-12

    Applicant: 广州大学

    Abstract: 本发明涉及一种利用时频域层级处理的低光照图像增强方法,包括步骤:S1、构建低光照图像数据集,包括低光照图像数据集的采集和标注,合理划分训练数据集和测试数据集;S2、建立低光照图像增强网络框架,使用深度学习中的卷积神经网络搭建整个网络框架;S3、进行模型训练,利用步骤S1划分好的训练数据集对步骤S2构建的低光照图像增强网络框架进行迭代训练;S4、进行模型测试,利用步骤S3训练后保存的模型对步骤S1划分好的测试数据集进行检测。本发明在深度学习框架下,结合时域与频域构建网络框架,利用数据驱动方式对低光照图像进行层级处理,实现图像亮度拉伸,生成清晰、低噪声的结果图像,使得低光照图像增强任务更高效。

    一种基于增强多模态对齐的广义零样本图像分类方法

    公开(公告)号:CN113139591B

    公开(公告)日:2023-02-24

    申请号:CN202110401006.X

    申请日:2021-04-14

    Applicant: 广州大学

    Abstract: 本发明公开了一种基于增强多模态对齐的广义零样本图像分类方法,该方法包括以下步骤:图像获取步骤:获取待识别图像;图像分类步骤:将待识别图像输入广义零样本图像分类模型中确定待识别图像的识别目标类别;广义零样本图像分类模型为通过训练步骤和测试步骤得出;训练步骤具体包括:特征编码步骤:采用两个超球面变分自编码器分别对训练样本的视觉特征和语义特征编码进共享的潜层空间中;潜层向量对齐步骤:将训练模型的优化方向趋向于视觉潜层向量和语义潜层向量的分布对齐;分布边界阈值获取步骤:寻找分布边界阈值。本发明通过超球面变分自编码器为视觉特征和语义特征构建潜层空间,使不同类的相互远离,提高已见类和未见类的识别效果。

Patent Agency Ranking