-
公开(公告)号:CN118096601A
公开(公告)日:2024-05-28
申请号:CN202410285664.0
申请日:2024-03-13
申请人: 上海大学
IPC分类号: G06T5/77 , G06T5/60 , G06N3/0464 , G06N3/048 , G06N3/08
摘要: 本公开提供一种基于小波变换与多尺度残差的图像修复方法及系统,其中,基于小波变换与多尺度残差的图像修复方法包括:获取图像数据集和掩码数据集,对图像数据集和掩码数据集进行预处理,确定受损图像和受损图像对应的掩码;将受损图像和受损图像对应的掩码输入预设的图像修复网络,对预设的图像修复网络进行模型训练,确定经过模型训练的图像修复网络;采用预设的损失函数对经过模型训练的图像修复网络进行优化处理,确定图像修复网络模型;将当前受损图像输入图像修复网络模型,确定当前受损图像的修复图像。通过本公开,实现对受损图像的修复并使得修复图像在纹理细节和感知细节贴合原始未受损图像,提高修复图像的图像质量。
-
公开(公告)号:CN112559810B
公开(公告)日:2022-04-08
申请号:CN202011533344.0
申请日:2020-12-23
申请人: 上海大学
IPC分类号: G06F16/901 , G06F16/903 , G06N3/04 , G06N3/08
摘要: 本发明公开了一种利用多层特征融合生产哈希码的方法及装置,包括:建立图文对的相似度矩阵;通过不同残差块的输出来获取不同层的特征,将所述不同层的特征转换为通道数和尺寸一致的特征图,然后进行融合,最后通过全局池化和全连接并离散化得到图像对应的哈希码;用多尺度融合模块为每个文本生成对应的多尺度BOW模型,然后通过卷积层获得不同尺度的特征并进行融合,最后通过全连接层得到文本对应的哈希码;设计损失函数;训练模型;利用训练得到的模型,将样本输入其中获得对应的哈希码。通过本发明,生成的哈希码辨别性更强,用于跨模态检索时可以有效地提高检索的平均准确率。
-
公开(公告)号:CN109905778B
公开(公告)日:2021-12-03
申请号:CN201910003111.0
申请日:2019-01-03
申请人: 上海大学
IPC分类号: H04N21/845 , H04N21/8549
摘要: 本发明公开了一种基于组稀疏编码的单个非结构化视频的可扩展缩略的方法。对每个非结构化视频,将视频均匀切分为一小组片段,进行向量化表示。选取前n个片段为初始视频摘要,并通过组稀疏编码进行重构,获得初始字典和重构系数。用当前字典对下一片段进行重构并计算重构误差。若重构误差大于设定阈值,当前片段加入摘要。依次处理每个片段直到结束获得最终的字典和重构系数。根据稀疏重建系数,建立可扩展缩略。本发明以最小化视频片段单独稀疏性的同时最大化视频片段整体可分性为优化目标,对传统视频缩略方法进行有效扩展,建立了单个非结构化视频的缩略构建框架。可扩展缩略满足了不同用户的要求,增强了用户对关键内容的视觉体验。
-
公开(公告)号:CN109905778A
公开(公告)日:2019-06-18
申请号:CN201910003111.0
申请日:2019-01-03
申请人: 上海大学
IPC分类号: H04N21/845 , H04N21/8549
摘要: 本发明公开了一种基于组稀疏编码的单个非结构化视频的可扩展缩略的方法。对每个非结构化视频,将视频均匀切分为一小组片段,进行向量化表示。选取前n个片段为初始视频摘要,并通过组稀疏编码进行重构,获得初始字典和重构系数。用当前字典对下一片段进行重构并计算重构误差。若重构误差大于设定阈值,当前片段加入摘要。依次处理每个片段直到结束获得最终的字典和重构系数。根据稀疏重建系数,建立可扩展缩略。本发明以最小化视频片段单独稀疏性的同时最大化视频片段整体可分性为优化目标,对传统视频缩略方法进行有效扩展,建立了单个非结构化视频的缩略构建框架。可扩展缩略满足了不同用户的要求,增强了用户对关键内容的视觉体验。
-
公开(公告)号:CN105872543A
公开(公告)日:2016-08-17
申请号:CN201610190391.7
申请日:2016-03-30
申请人: 上海大学
IPC分类号: H04N19/147 , H04N19/30 , H04N19/176
CPC分类号: H04N19/147 , H04N19/176 , H04N19/30
摘要: 本发明公开了一种MVD视点可分级编码中的快速模式选择方法。基本层编码,纹理视频T2采用全遍历的编码模式选择方法,纹理视频T1根据当前MB的纹理复杂度、空间相邻MB和视间对应MB的编码模式简化候选编码模式;纹理视频T2编码进一步考虑了当前MB的运动特性。增强层编码,深度视频D2利用当前MB的深度边界分布情况及纹理视频T2对应MB的编码模式,深度视频D0/D1利用当前MB在SKIP或Inter16x16模式下CBP值及深度视频D2对应MB编码模式简化编码候选模式。本发明在编码基本层纹理视频和增强层深度视频时,利用视点间的相关性、宏块本身的复杂度以及运动情况等信息,提前终止编码模式的选择过程,降低编码的时间复杂度,解决了MVD编码过程中编码模式选择时间开销过大的问题。
-
公开(公告)号:CN105872561B
公开(公告)日:2019-07-23
申请号:CN201511015791.6
申请日:2015-12-29
申请人: 上海大学
IPC分类号: H04N19/597 , H04N19/107 , H04N19/34 , H04N19/19 , H04N19/147
摘要: 本发明涉及一种可分级多视点视频加深度宏块编码模式快速选择方法,其步骤是:1.基本视V0编码:使用全遍历选择方式编码纹理视频T0;根据对应T0宏块的编码模式,快速选择深度视D0宏块的编码模式。2.增强视V1编码:对纹理视频T1,根据其参考视点T0和D0的宏块编码模式以及宏块纹理复杂度之间的关系,快速选择当前宏块的编码模式;对深度视频D1,根据参考视点T1对应位置宏块的编码模式以及当前深度宏块在DIRECT或Inter16x16模式下的CBP值快速选择当前深度宏块的编码模式。3.增强视V2编码:参考步骤2中原理,但纹理视频T2参考视点T1和D1,深度视频D2参考视点T2。本方法在编码增强视的纹理视频和深度视频时,可提前终止模式选择的过程,降低编码的时间复杂度。
-
公开(公告)号:CN106101709B
公开(公告)日:2019-04-16
申请号:CN201610532140.2
申请日:2016-07-08
申请人: 上海大学
IPC分类号: H04N19/30 , H04N19/503 , H04N19/19 , H04N19/53
摘要: 本发明涉及一种联合增强层的SHVC质量可分级的基本层帧间预测方法。本方法的具体步骤是:步骤1.基本层BL编码:使用高级运动矢量预测技术获得预测运动矢量列表;更改基本层原始运动估计算法,利用增强层重建帧进行基本层的运动估计;利用获得运动矢量进行运动补偿。步骤2.增强层EL编码:维持原始帧间预测技术不变:依次进行高级运动矢量预测技术获得预测运动矢量列表;根据预测运动矢量列表先进行整像素运动估计,再进行分像素运动估计,最终获得最优运动矢量;利用运动估计获得的运动矢量进行运动补偿。本方法在编码两层质量可分级时,可提高编码效率,降低码率。
-
公开(公告)号:CN112070696B
公开(公告)日:2024-11-05
申请号:CN202010926365.2
申请日:2020-09-07
申请人: 上海大学
摘要: 本发明提供了一种基于纹理与结构分离的图像修复方法及系统,采用相对总变分图像平滑模型对待修复图像进行分离,得到待修复图像的纹理图像和结构图像;对于结构图像,使用张量投票模型,预测待修复结构图像缺失区域边缘信息;基于预测得到的缺失区域边缘信息,优化基于样本块修复算法的优先级函数,进而对结构图像进行修复,得到结构修复结果;对于纹理图像,采用多样本块融合的次优匹配块修复方法,对纹理图像进行修复,得到纹理修复结果;结合结构修复结果和纹理修复结果,实现对图像的修复。本发明充分利用图像的已知信息,在保持修复结果结构性连续的同时,合理的恢复出图像的纹理部分,在修复结果的主观质量和客观指标上都得到了明显的提升。
-
公开(公告)号:CN114020964B
公开(公告)日:2024-10-22
申请号:CN202111346288.4
申请日:2021-11-15
申请人: 上海大学
IPC分类号: G06F16/783 , G06F16/78 , G06N3/0442 , G06N3/0464 , G06N3/08
摘要: 本发明提供一种利用记忆网络和门控循环单元实现视频摘要的方法,包括:预处理数据集,获取视频的视频帧特征;设计以所述视频帧特征为输入,以帧重要性分数为输出的整体网络模型;整体网络模型中进行模型训练;将从完成训练的整体网络模型中得到的帧重要性分数转换为关键镜头;将所述关键镜头组合为动态视频摘要,测试视频摘要结果。本发明,其整体网络模型将输入的视频进行特征处理,利用帧重要性分数获取动态视频摘要,提高了模型的整体有效性。
-
公开(公告)号:CN110009708B
公开(公告)日:2020-08-28
申请号:CN201910283493.7
申请日:2019-04-10
申请人: 上海大学
摘要: 本发明提供了一种基于图像色彩分割的发色变换方法,包括:S1,采集图像,对图像进行预处理;S2,对S1中得到的预处理后的图像进行背景滤除处理;S3,对S2中得到的图像中的人像进行人脸识别和人眼识别,进一步分割出头发模块,并对眼睛部分进行遮蔽处理;S4,提取原图像中发色像素的多个像素点,并求出多个像素点的平均值以代替发色像素,基于替代后的发色像素,对S3中得到的进行遮蔽处理后的图像进行发色变换处理;S5,对S4中得到的发色变换后的图像进行背景恢复处理。同时提供了一种基于图像色彩分割的发色变换系统、终端。本发明技术操作简单,可有效排除干扰,快速、准确地实现发色的变换。
-
-
-
-
-
-
-
-
-