一种基于注意力机制的隐式神经表达方法和系统

    公开(公告)号:CN118709722A

    公开(公告)日:2024-09-27

    申请号:CN202410818299.5

    申请日:2024-06-24

    申请人: 南京大学

    摘要: 本发明公开了一种基于注意力机制的隐式神经表达方法和系统,包括根据获取的输入信号的输入张量,利用重组合注意力机制单元,得到所述输入张量对应的重组空间信息;基于所述重组空间信息,利用通道重校准注意力机制单元,得到校准特征向量;根据所述校准特征向量,得到所述输入信号对应的隐式神经输出;本发明通过重组合注意力机制单元,能够对输入信号的空间信息进行重组,有利于增强表示能力,通过通道重校准注意力机制单元,能够动态地增强或抑制不同通道的原始特征,使得隐式神经表达的多层感知机能够更好地表达信号,并有利于提升输入信号的隐式神经的表达质量。

    一种基于MLP无需分块嵌入映射的视觉识别方法

    公开(公告)号:CN116563613A

    公开(公告)日:2023-08-08

    申请号:CN202310401160.6

    申请日:2023-04-15

    申请人: 南京大学

    摘要: 本发明提出了一种基于MLP无需分块嵌入映射的视觉识别方法。该方法通过引入一种新的提取特征的方法,对视觉特征提取完全解耦合,从宽度,高度和通道三个维度单独地顺序地交替地进行特征提取,在保证模型表示能力的前提下极大降低了模型的参数量。本发明对于现有的多层感知机模型,是首个完全使用全连接层堆叠而成的模型,无需对输入图像进行卷积映射编码或分块嵌入等操作。

    一种基于深度学习模型参数空间重参数化的视觉识别方法

    公开(公告)号:CN116310724A

    公开(公告)日:2023-06-23

    申请号:CN202310277216.1

    申请日:2023-03-21

    申请人: 南京大学

    发明人: 蔡志成 曹汛 沈秋

    摘要: 本发明公开了一种基于深度学习模型参数空间重参数化的视觉识别方法。该方法的步骤包括:(1)使用给定的优化配置和输入,在初始参数空间训练深度学习模型至完全收敛;(2)将参数W作为基Wbasis,引入可学习变换T作用于基Wbasis,产生相应的额外可学习参数Wtrain,该参数对对应基Wbasis的空间进行动态拉伸,构造新的参数化空间;(3)在新的参数化空间中,使用相同的优化配置对模型进行进一步的优化至完全收敛。本发明利用可学习变换,以初始模型学习到的权重作为基动态拉伸初始参数空间,在新构造的重参数化空间对收敛完成的模型进行进一步的优化,进一步增强视觉模型的识别能力,突破模型的性能瓶颈。

    一种基于B-MLP的三维人脸识别方法

    公开(公告)号:CN116229550A

    公开(公告)日:2023-06-06

    申请号:CN202310191003.7

    申请日:2023-03-02

    申请人: 南京大学

    摘要: 本发明提出了一种基于B‑MLP的三维人脸识别方法,包括:获取人脸三维点云数据并过滤背景信息得到原始点云;对原始点云进行预处理操作得到预处理后的目标点云;在目标点云中检测鼻尖点并截取鼻尖区域为特征点云进行球坐标变换;计算目标点云中各点到鼻尖点的测地距离,进行保形分段三次插值,得到点数相同的人脸面部曲线;计算人脸面部曲线的特征作为神经网络即B‑MLP模型的输入数据;使用输入数据训练B‑MLP模型进行人脸识别,所有输入数据组成人脸数据库,计算人脸数据库中所有点云的概率分布,选择概率最大的人脸,完成基于B‑MLP的三维人脸识别。

    一种基于深度卷积神经网络模型-重生网络的视觉识别方法

    公开(公告)号:CN112257800A

    公开(公告)日:2021-01-22

    申请号:CN202011185864.7

    申请日:2020-10-30

    申请人: 南京大学

    IPC分类号: G06K9/62 G06N3/04 G06N3/08

    摘要: 基于深度卷积神经网络模型‑重生网络的视觉识别方法,采用“重生机制”的“重生模块”搭建一种新型深度卷积神经网络模型,引入的重生机制对被ReLU函数截断死亡的神经元进行重生再造,“重生机制”的实现流程:在重生网络中,引入并实现重生机制的模块称为重生模块;首先,重生模块的输入x为上层卷积层得到的特征映射,先将x输入传统的ReLU函数,得到激活后的特征映射x1,这样就筛选出取值为正的神经元,并截断负值的神经元;同时,将输入x取反,并行地将‑x输入ReLU函数,得到激活后的特征映射x2*,这样就筛选出取值为负的神经元,并截断正值的神经元;对取值为负的神经元进行筛选后,对它们进行逆卷积操作,然后与正值进行通道级联,就是负神经元的重生过程。

    一种基于深度卷积神经网络模型-重生网络的视觉识别方法

    公开(公告)号:CN112257800B

    公开(公告)日:2024-05-31

    申请号:CN202011185864.7

    申请日:2020-10-30

    申请人: 南京大学

    摘要: 基于深度卷积神经网络模型‑重生网络的视觉识别方法,采用“重生机制”的“重生模块”搭建一种新型深度卷积神经网络模型,引入的重生机制对被ReLU函数截断死亡的神经元进行重生再造,“重生机制”的实现流程:在重生网络中,引入并实现重生机制的模块称为重生模块;首先,重生模块的输入x为上层卷积层得到的特征映射,先将x输入传统的ReLU函数,得到激活后的特征映射x1,这样就筛选出取值为正的神经元,并截断负值的神经元;同时,将输入x取反,并行地将‑x输入ReLU函数,得到激活后的特征映射x2*,这样就筛选出取值为负的神经元,并截断正值的神经元;对取值为负的神经元进行筛选后,对它们进行逆卷积操作,然后与正值进行通道级联,就是负神经元的重生过程。

    一种利用深度学习算法实现垃圾分类的方法

    公开(公告)号:CN112487938A

    公开(公告)日:2021-03-12

    申请号:CN202011349429.3

    申请日:2020-11-26

    申请人: 南京大学

    摘要: 一种利用深度学习算法实现垃圾分类的方法,1)将轻量级卷积神经网络模型squeezenet用于垃圾分类:将单张经预处理的垃圾图片输入训练完成的squeezenet模型,最终得到4种输出中的一种,即为该图片中垃圾的种类;2)里用卷积核提取垃圾图片特征:在CNN中用卷积核对图像进行卷积操作,能够提取图像特征,经由训练得到最优参数的卷积核,得以准确识别垃圾图片;3)用Adam算法对神经网络进行训练优化。