-
公开(公告)号:CN116342998A
公开(公告)日:2023-06-27
申请号:CN202211589607.9
申请日:2022-12-09
Applicant: 广州大学
IPC: G06V10/82 , G06V10/764 , G06V10/774 , G06V10/80 , G06N3/045 , G06N3/0464 , G06N3/084
Abstract: 本发明涉及计算机视觉技术领域,且公开了融合注意力机制的多通道卷积神经网络图像识别方法,包括S3将二次补丁嵌入融合后的图像特征进行尺寸和方向的调节,并在卷积层和池化层中将融合后得到的图像特征可统一大小尺寸进行比对,并根据不同的角度进行调整,识别图像特征的多样性。本发明中S2‑1中对注意力机制融合后的图像特征进行数值初始化,并根据得到的初始化数值进行训练,并对训练后的特征进行提取,通过对初始化数值进行多次补丁嵌入训练,将训练后得到的数值进行卷积操作,得到训练后的图像特征,并与训练前的图像特征进行对比,达到弥补遗漏的细节特征,最后对细节特征进行分类,有效的避免同类别的图像识别差异大的问题。
-
公开(公告)号:CN116433960A
公开(公告)日:2023-07-14
申请号:CN202310236229.4
申请日:2023-03-10
Applicant: 广州大学
IPC: G06V10/764 , G06V10/774 , G06V10/77
Abstract: 本发明公开了一种核化的逆近邻判别分析方法,包括如下步骤:获得训练图像样本;利用高斯核函数将输入数据映射到高维空间;利用核技巧以及逆近邻算法得到训练图像样本在高维空间中的类内散度矩阵和类间散度矩阵的表达;通过特征分解学习最大化类间散度矩阵和最小化类内散度矩阵的投影矩阵;利用投影矩阵对训练和测试图像样本进行特征提取;使用最近邻算法对测试样本进行分类。本发明首次将逆近邻线性判别分析方法推广到高维空间,以解决非线性数据的分类问题,提出使用高斯核函数进行高维映射,对该算法进行核化,利用核技巧进行非显式映射的推导,在高斯函数映射后的空间中建立高维逆近邻进而求取散度矩阵,其中利用核技巧实现高维空间中的距离表达。
-
公开(公告)号:CN116168247A
公开(公告)日:2023-05-26
申请号:CN202310180179.2
申请日:2023-02-27
Applicant: 广州大学
IPC: G06V10/764 , G06V10/74 , G06V10/40 , G06V10/771 , G06V10/77 , G06N20/00
Abstract: 本发明公开了一种基于特征谱正则化的逆近邻线性判别分析方法及装置,包括,获取已分类的训练图像集合;根据训练图像集合计算邻内散度矩阵,对邻内散度矩阵进行特征分解得到特征向量和特征值;对邻内散度矩阵的特征值进行正则化形成多种加权函数,选择多个加权函数中的其中之一对特征向量进行加权处理得到加权特征向量,使用加权特征向量对训练图像集合中每个图像的像素值进行投影得到新的图像特征;根据新的训练图像集合特征计算总体散度矩阵。在逆近邻线性判别分析方法的基础上加入了特征谱正则化技术,从而避免普通线性判别分析中由于训练样本过少而导致的类内散度矩阵奇异,难以使用特征分解求取最优投影矩阵的问题。
-
-