-
公开(公告)号:CN116980600A
公开(公告)日:2023-10-31
申请号:CN202311004860.8
申请日:2023-08-10
Applicant: 哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院)
IPC: H04N19/146 , H04N19/147 , H04N19/91 , G06T9/00
Abstract: 本发明提供一种基于范数约束的高效神经网络图像压缩方法、系统及存储介质,该方法包括:步骤S101:输入图像经过稀疏下采样卷积模块,生成特征表示,并得到对应卷积层范数N;步骤S102:特征表示经过非线性模块得到Z;步骤S103:重复执行所述步骤S101、S102K次,得到图像的潜在表示;步骤S104:将得到的潜在表示经过量化单元,得到量化后的潜在表示;步骤S105:量化后的潜在表示经无损编码模块,将潜在表示转换为比特流;步骤S106:二进制码流经过信号传输,通过无损解码模块,还原为潜在表示。本发明的有益效果是:能够大幅度降低模型的参数量与计算复杂度,解决高性能图像压缩难以部署的问题。
-
公开(公告)号:CN116800975A
公开(公告)日:2023-09-22
申请号:CN202310727845.X
申请日:2023-06-16
Applicant: 哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院)
IPC: H04N19/42 , H04N19/132 , H04N19/91 , H04N19/124
Abstract: 本发明提供了一种图像压缩处理方法、系统及介质,方法包括:在获取到输入图像后,通过重参化下采样模块得到特征图f2;通过重参化非线性特征增强模块对特征图f2特征进行提取,得到强化的特征图f3;进行重复下采样与非线性增强得到图像的潜在表示y;将潜在表示y进一步压缩数据,得到量化后的潜在表示y’;将量化后的潜在表示转换为比特流;采用熵模型得到码率;通过无损解码模块,将其还原为潜在表示y’;将潜在表示y’输入结构重参化上采样模块,获取特征图g2;将特征图g2输入可重参化非线性特征增强模块,得到特征图g3;经过重参化上采样和非线性增强后获得模型重建图像x’。本发明解决了高性能图像压缩模型难以部署的问题。
-
公开(公告)号:CN115776571B
公开(公告)日:2023-04-28
申请号:CN202310094255.8
申请日:2023-02-10
Applicant: 哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院)
IPC: H04N19/60 , H04N19/91 , H04N19/124
Abstract: 本申请公开了一种图像压缩方法、装置、设备及存储介质,涉及图像压缩领域,包括:对当前待压缩数据进行下采样得到初始特征;通过宽特征空间变换层对初始特征分别进行空间维度和通道维度变换并对空间变换后特征和通道变换后特征进行融合和特征提取;将得到的紧凑特征表示与初始特征进行连接得到输出特征,将输出特征作为新的当前待压缩数据并跳转至对当前待压缩数据进行下采样的步骤,直至达到迭代次数,将当前的输出特征作为潜在特征;对潜在特征进行量化并基于概率分布对量化后特征进行熵编码得到二进制码流;基于二进制码流确定图像压缩结果。本申请采用空间和通道双分支融合变换,利用空间与通道的相关性实现更高效的特征提取,提升压缩性能。
-
公开(公告)号:CN114998457B
公开(公告)日:2022-11-22
申请号:CN202210915500.2
申请日:2022-08-01
Applicant: 哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院)
Abstract: 本申请实施例公开了一种图像压缩方法、图像解压方法及相关设备、可读存储介质,用于拟合低中高频率的信息,提高图片压缩的率失真性能。本申请实施例方法包括:获得待压缩图像中每个像素点在空间域的二维坐标向量,将待压缩图像及二维坐标向量输入多层感知机中的输入层,得到输入层输出的每个像素点在频域中各个频率的多维向量,将像素点的多维向量输入多层感知机中级联的N个隐藏层,由N个隐藏层对多维向量的全局特征及局部特征进行级联处理后,得到第N级隐藏层输出的第N综合特征向量,将像素点的第N综合特征向量输入多层感知机中的输出层,由输出层输出像素点对应的压缩后像素值,根据每个像素点对应的压缩后像素值,获得压缩后的目标图像。
-
公开(公告)号:CN114598886A
公开(公告)日:2022-06-07
申请号:CN202210496086.6
申请日:2022-05-09
Applicant: 哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院)
Abstract: 本发明实施例公开了一种图像编码的方法、解码的方法及相关装置,用于提升端到端压缩方法的性能。本发明实施例方法包括:将待压缩的第一图像输入至载波生成器,得到对应于第一图像的一级低频载波信号,其中,载波生成器包括神经网络,以使得一级低频载波信号的频率范围适应于神经网络的频率学习范围;利用一级低频载波信号对第一图像进行调制,以将第一图像的频率调制至适合所述神经网络学习的频率范围,得到调制后的图像信号;将调制后的图像信号输入至下采样卷积神经网络,以对调制后的图像信号的图像特征进行特征压缩,得到一级压缩后的第二图像信号;对第二图像信号执行无损编码,以得到编码后的码流。
-
公开(公告)号:CN115866252A
公开(公告)日:2023-03-28
申请号:CN202310087275.2
申请日:2023-02-09
Applicant: 哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院)
IPC: H04N19/132 , H04N19/124 , H04N19/80 , H04N19/91
Abstract: 本申请公开了一种图像压缩方法、装置、设备及存储介质,涉及图像压缩领域,包括:对紧凑特征进行多速率通道采样以及相应的滤波和多速率空间采样并对得到的初始特征集进行量化;基于当前概率对量化后特征集中的当前特征进行熵编码得到二进制码流,再进行熵解码得到潜在特征;将下一个特征作为新的当前特征并基于先验预测器确定的与潜在特征对应的方差和均值对当前特征进行估计得到新的当前概率,然后跳转至基于当前概率对量化后特征集中的当前特征进行熵编码的步骤,直至所有特征均进行过熵编码;基于所有二进制码流确定图像压缩结果。本申请利用多速率通道采样和空间采样对熵编码的计算量和参数量进行精简,利用先验预测器实现更精准的概率估计。
-
公开(公告)号:CN114581544A
公开(公告)日:2022-06-03
申请号:CN202210496064.X
申请日:2022-05-09
Applicant: 哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院)
Abstract: 本申请实施例公开了一种图像压缩方法、计算机设备及计算机存储介质,编码端码率控制模块可对权重因子映射为码率控制向量,并将码率控制向量与稀疏特征图相乘,得到指定码率的潜在特征表示,量化单元将指定码率的潜在特征表示中的浮点数量化为整数,得到整数型潜在特征表示,无损编码模块对整数型潜在特征表示进行熵编码,得到二进制码流,因此,只需要训练一个目标神经网络图像压缩模型,且只需调节权重因子即可实现对图像的压缩率、码率和重建质量的任意调节,从而无需训练多个图像压缩模型,计算机设备也无需部署多个图像压缩模型,大大减少了用户设备的硬件存储开销。稀疏特征图的元素个数大大减少,可减少后续模块的计算量,节约计算资源。
-
公开(公告)号:CN115914630B
公开(公告)日:2023-05-30
申请号:CN202310016678.8
申请日:2023-01-06
Applicant: 哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院)
IPC: H04N19/124 , H04N19/42 , H04N19/44 , G06N3/04 , G06N3/08 , G06V10/44 , G06V10/764 , G06V10/82
-
公开(公告)号:CN115834890A
公开(公告)日:2023-03-21
申请号:CN202310082419.5
申请日:2023-02-08
Applicant: 哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院)
IPC: H04N19/146 , H04N19/147 , G06T9/00 , G06N3/045 , G06N3/048
Abstract: 本申请公开了一种图像压缩方法、装置、设备及存储介质,涉及图像处理技术领域,包括:基于预设图像码率对原始图像的像素坐标进行编码得到若干编码信号;根据图像码率对编码信号进行分组得到若干分组信号;利用预设多层感知机网络对分组信号进行处理得到若干第一目标信号,并利用点乘运算对第一目标信号进行处理得到点乘后信号;利用预设多层感知机网络对点乘后信号进行处理以得到与图像RGB值对应的第二目标信号;基于预设损失函数和第二目标信号对预设神经网络进行训练得到训练后网络参数,并基于训练后网络参数生成图像压缩结果。由此可见,本申请可以通过隐式神经得到与预设图像码率对应的信号,能很好适应设备硬件的性能并提升了传输效率。
-
公开(公告)号:CN114998457A
公开(公告)日:2022-09-02
申请号:CN202210915500.2
申请日:2022-08-01
Applicant: 哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院)
Abstract: 本申请实施例公开了一种图像压缩方法、图像解压方法及相关设备、可读存储介质,用于拟合低中高频率的信息,提高图片压缩的率失真性能。本申请实施例方法包括:获得待压缩图像中每个像素点在空间域的二维坐标向量,将待压缩图像及二维坐标向量输入多层感知机中的输入层,得到输入层输出的每个像素点在频域中各个频率的多维向量,将像素点的多维向量输入多层感知机中级联的N个隐藏层,由N个隐藏层对多维向量的全局特征及局部特征进行级联处理后,得到第N级隐藏层输出的第N综合特征向量,将像素点的第N综合特征向量输入多层感知机中的输出层,由输出层输出像素点对应的压缩后像素值,根据每个像素点对应的压缩后像素值,获得压缩后的目标图像。
-
-
-
-
-
-
-
-
-