-
公开(公告)号:CN109245773B
公开(公告)日:2021-09-28
申请号:CN201811279234.9
申请日:2018-10-30
Applicant: 南京大学
Abstract: 本发明涉及基于块循环稀疏矩阵神经网络的编解码方法,对具有块循环稀疏权值矩阵的全连接神经网络进行压缩编码;利用权值矩阵的循环特性和稀疏性,设计的采取掩模矩阵和非零值列表的编码方法;利用输入激励的稀疏性,设计的采取掩模向量和非零值列表的编码方法;充分利用了掩模矩阵和循环矩阵的特点,采用了硬件友好的解码方法。有益效果为:对稀疏的输入激励向量和权值矩阵同时进行压缩编码,有效减少数据所需的存储空间和运算过程中搬运数据所需的存储接入次数。在神经网络运算过程中,该方法能够有效降低访存消耗的能量,便于处理器跳过不必要的运算,提高硬件系统的吞吐率。
-
公开(公告)号:CN109509137A
公开(公告)日:2019-03-22
申请号:CN201810966120.5
申请日:2018-08-22
Applicant: 南京大学
IPC: G06T1/00
Abstract: 本发明涉及一种嵌入比16分之一的图片水印嵌入及盲提取方法,水印嵌入方法包括如下步骤:步骤1)将载体图片分成若干4*4的图像块,并形成对应的RGB矩阵;在RGB转Y的模块中,通过色彩空间转换公式将RGB矩阵转换呈Y矩阵;步骤2)通过式(2)求出Y矩阵DCT变换域的直流分量DC;步骤3)根据式(2)结合式(3)通过同时裁剪离散余弦变换和离散余弦变换逆变换两个变换,并进一步进行裁剪色彩空间转换的操作,实现将水印信息直接嵌入在RGB通道上。有益效果:解决水印嵌入比由传统的1/64提升到1/16时,传统方法所面临的载体图片失真严重和水印提取质量较差的问题。
-
公开(公告)号:CN109245773A
公开(公告)日:2019-01-18
申请号:CN201811279234.9
申请日:2018-10-30
Applicant: 南京大学
Abstract: 本发明涉及基于块循环稀疏矩阵神经网络的编解码方法,对具有块循环稀疏权值矩阵的全连接神经网络进行压缩编码;利用权值矩阵的循环特性和稀疏性,设计的采取掩模矩阵和非零值列表的编码方法;利用输入激励的稀疏性,设计的采取掩模向量和非零值列表的编码方法;充分利用了掩模矩阵和循环矩阵的特点,采用了硬件友好的解码方法。有益效果为:对稀疏的输入激励向量和权值矩阵同时进行压缩编码,有效减少数据所需的存储空间和运算过程中搬运数据所需的存储接入次数。在神经网络运算过程中,该方法能够有效降低访存消耗的能量,便于处理器跳过不必要的运算,提高硬件系统的吞吐率。
-
公开(公告)号:CN110058841B
公开(公告)日:2023-03-28
申请号:CN201910321975.7
申请日:2019-04-22
Applicant: 南京大学
IPC: G06F7/544
Abstract: 本发明提供了一种面向具有对称性的非线性函数的通用计算装置和方法。计算装置包括取绝对值单元、地址索引单元、查找表单元、乘加单元、取符号位单元、减法器和选择器。其中,地址索引单元包括比较器、控制器、地址寄存器和分段端点存储器。本发明提供的面向具有对称性的非线性函数计算装置,可以计算任意具有轴对称或中心对称的非线性函数值,具有一定的通用性。同时本发明根据目标分段线性函数与原始非线性函数的最大绝对误差对原始非线性函数进行分段处理,可实现近似计算结果的精度可控。
-
公开(公告)号:CN110058841A
公开(公告)日:2019-07-26
申请号:CN201910321975.7
申请日:2019-04-22
Applicant: 南京大学
IPC: G06F7/544
Abstract: 本发明提供了一种面向具有对称性的非线性函数的通用计算装置和方法。计算装置包括取绝对值单元、地址索引单元、查找表单元、乘加单元、取符号位单元、减法器和选择器。其中,地址索引单元包括比较器、控制器、地址寄存器和分段端点存储器。本发明提供的面向具有对称性的非线性函数计算装置,可以计算任意具有轴对称或中心对称的非线性函数值,具有一定的通用性。同时本发明根据目标分段线性函数与原始非线性函数的最大绝对误差对原始非线性函数进行分段处理,可实现近似计算结果的精度可控。
-
公开(公告)号:CN108733627A
公开(公告)日:2018-11-02
申请号:CN201810412919.X
申请日:2018-04-30
Applicant: 南京大学
IPC: G06F17/16
Abstract: 本发明公开了一种正定矩阵Cholesky分解的FPGA实现方法,主要包括:顶层控制模块,用于模块之间的通信和控制;数据预处理模块,用于将正定矩阵分解为两个用于矩阵计算模块中计算操作的矩阵;矩阵计算模块对数据预处理模块得到的两个矩阵进行计算,得到最终的Cholesky分解计算结果。有益效果是:用传统硬件直接实现正定矩阵Cholesky分解,算法复杂,占用面积大,耗费资源多,而利用CORDIC算法的旋转特性实现正定矩阵Cholesky分解,实现方式简单,只需要利用位操作,耗费资源少,有效地减少了运算复杂度和门电路的面积。
-
-
-
-
-