基于图像重构卷积神经网络的低码率视频编解码方法

    公开(公告)号:CN110087092A

    公开(公告)日:2019-08-02

    申请号:CN201910182160.5

    申请日:2019-03-11

    摘要: 本发明提出了一种基于图像重构卷积神经网络的低码率视频编解码方法,用以解决现有技术中存在的在低码率下视频编解码后视频有严重压缩失真的问题,其实现步骤为:对输入视频通过下采样操作后得到低分辨率的视频,再使用标准X265编解码器对低分辨率视频进行视频编解码,得到解码后的低分辨率视频,将解码后的低分辨率视频输入到训练好的图像重构卷积神经网络,然后得到与输入视频相同分辨率的重构视频。本发明能够在低码率下有效抑制视频编解码带来的严重压缩失真,能够很好地提升视频的质量。

    基于卷积神经网络的水下图像复原方法

    公开(公告)号:CN109584170A

    公开(公告)日:2019-04-05

    申请号:CN201811271076.2

    申请日:2018-10-29

    IPC分类号: G06T5/00

    摘要: 本发明公开了一种单幅水下图像复原方法,主要解决现有技术在处理水下图像时色偏校正和清晰化处理效果欠佳的问题。其方案是:在Caffe框架下分别构建环境光估计网络和透射率估计网络;获取一组深度图像集J和d(J),随机生成透射率T和环境光A,合成水下图像集I;将I、A按批量依次循环输入至环境光估计网络进行训练;再将I、T按批量依次循环输入至透射率估计网络进行训练;将待处理的图像Ic输入至完成训练的神经网络,输出环境光Ac和透射率Tc;根据Ac和Tc计算得到清晰图像Jc。本发明提高了图像对比度并能校正色偏,其峰值信噪比、结构相似性和色差公式三个指标均优于现有技术,可用于水下图像的清晰化处理。

    基于层的3D-HEVC深度图帧内预测编码方法

    公开(公告)号:CN105791863B

    公开(公告)日:2018-11-30

    申请号:CN201610172216.5

    申请日:2016-03-24

    IPC分类号: H04N19/597 H04N19/96

    摘要: 本发明公开了一种基于层的3D‑HEVC深度图帧内预测编码的方法,主要解决现有的技术对深度图帧内预测编码处理复杂度较高的问题。其技术方案为:1)初始化文件和门限;2)记录测试码流每个编码周期的第一帧数据;3)通过计算编码周期第一帧的命中率得到门限;4)根据门限,选择性跳过当前预测单元的粗选阶段深度模式、细选阶段或全部粗选细选阶段,完成一帧视频视频编码;5)重复步骤2)到4)遍历每帧视频,直到编码结束。本发明具有编码复杂度低、方法多样性的优点,可用于视频编码。

    基于HEVC熵编码器的集成电路设计方法

    公开(公告)号:CN106911935A

    公开(公告)日:2017-06-30

    申请号:CN201710255725.9

    申请日:2017-04-19

    摘要: 本发明提出了一种基于HEVC标准的熵编码器集成电路设计方法,用于解决现有熵编码器集成电路设计方法中存在的硬件开销大和实现复杂度高的技术问题,实现步骤为:创建不同规格的寄存器并初始化;计算HEVC熵编码器用到的各语法元素二元符号长度;计算4×4子块二元符号串长度和全零标志位并存储到相应的小寄存器中;根据TU块规格和子块在TU块中的位置坐标,将小寄存器中存储的值分别存储到相应的大寄存器中;计算TU块中已计算得到二元符号串长度的子块个数并将该数值存储到相应寄存器;根据该数值与TU块包含子块总数的比较结果和TU块的规格,对TU块的下一个子块和TU块进行不同操作;计算TU块二元符号串长度。

    一种网络延时抖动平滑方法

    公开(公告)号:CN103795649B

    公开(公告)日:2017-05-17

    申请号:CN201410046547.5

    申请日:2014-02-10

    IPC分类号: H04L12/885

    摘要: 本发明公开了一种网络延时抖动平滑方法,包括:利用指数平滑预测法预测网络抖动的大小和变化趋势;利用网络抖动的预测结果,设置数据缓冲器的大小。本发明能够较好的预测网络延时抖动大小的变化,有效减少了变化的网络抖动中的异常值,减小了丢包率,与其他方法相比有一定的优越性,并且无需各个系统模块时钟同步。

    基于三阶段特征提取的自监督图像去噪方法

    公开(公告)号:CN118097159A

    公开(公告)日:2024-05-28

    申请号:CN202410210510.5

    申请日:2024-02-26

    摘要: 本发明公开了一种基于三阶段特征提取的自监督图像去噪方法,主要解决现有方法特征提取能力差且恢复的图像色偏严重和纹理不清晰的问题。包括:利用Pytorch框架分别构建基于局部位置掩码卷积的盲点生成子网络和双分支互补特征提取子网络,在此基础上建立基于三阶段特征提取的自监督图像去噪网络,构建其损失公式;获取噪声图像集作为训练集,并将其按批量大小组成多个图像组,依次循环输入去噪网络进行迭代训练;将需要去噪的图像输入至训练完成的自监督去噪网络,得到清晰无噪声图像。本发明能在去除噪声的同时更好的恢复图像色彩和细节信息,且峰值信噪比和结构相似性两个指标均高于现有技术,可用于真实噪声图像的清晰化处理。

    一种视频画面抖动等级评估的方法

    公开(公告)号:CN116193103A

    公开(公告)日:2023-05-30

    申请号:CN202211599631.0

    申请日:2022-12-12

    IPC分类号: H04N17/00 H04N21/44

    摘要: 一种视频画面抖动等级评估的方法,包括以下步骤;对待检测视频进行分帧处理,同时对每一帧的分辨率进行下采样得到帧序列;将帧序列中每相邻两帧输入基于深度学习的实时光流提取网络中,提取光流图;对于相邻帧,在前一帧即上均匀选取特征点,将特征点的坐标与光流提取网络输出的对应的光流分量相加得到特征点在后一帧对应的坐标进行仿射变换估计,输出第i帧到第i+1帧的帧间整体的仿射变换矩阵;计算待检测视频的累计变换序列;对视频的累计变换序列计算评估指标并进行加权运算,输出待检测视频的每一秒的抖动分数,根据抖动程度阈值判断待检测视频是否发生抖动,以及抖动的程度。本发明能提高不同抖动情形下视频抖动检测与评估的准确率和鲁棒性。

    一种基于深度学习的动态场景HDR重建方法

    公开(公告)号:CN111242883B

    公开(公告)日:2023-03-28

    申请号:CN202010026179.3

    申请日:2020-01-10

    IPC分类号: G06T5/50 G06T7/00 G06T7/33

    摘要: 本发明公开了一种基于深度学习的动态场景HDR重建方法,克服了现有技术中图像处理效果有待改进的问题。该发明含有以下步骤,在同一静态场景内用固定相机获取欠曝光、正常曝光和过曝光三幅图像;在动态场景中,用手持相机获取上述三幅图像,记为D1、D2和D3;用LK光流法对D1、S2和D3进行配准,图像序列记为R1、R2和R3和步骤1中得到的Ground Truth组成配对的训练集;利用相机相应曲线将R1、R2和R3变换到线性域,记为H1、H2和H3;利用对比度算子提取H1、H2和H3图像中的亮度信息,记为M1、M2和M3;利用梯度算子提取R1、R2和R3图像中细节信息,记为L1、L2和L3;设计基于Resnet的Attention模块。该技术生成的HDR图像细节丰富,对比度高,具有广色域高动态范围。

    基于编码损伤修复的视频超分辨方法

    公开(公告)号:CN110751597B

    公开(公告)日:2023-03-28

    申请号:CN201910967743.9

    申请日:2019-10-12

    摘要: 本发明提出了一种基于编码损伤修复的视频超分辨方法,其实现步骤为:构建深度卷积神经网络;生成训练数据集;训练深度卷积神经网络;对视频图像进行下采样;对低分辨率视频进行编解码;对重建视频进行图像超分辨处理。本发明解决了现有视频图像超分辨方法中存在的无法达到实时处理要求、针对图像编码损伤的修复不足与放大尺度不足的问题,增强了网络针对编码损伤的学习能力,提升了图像超分辨的处理范围、处理速度与解码后的视频质量。

    基于卷积长短期记忆神经网络的视频损伤修复方法

    公开(公告)号:CN111866511B

    公开(公告)日:2022-03-15

    申请号:CN202010794331.2

    申请日:2020-08-10

    摘要: 本发明涉及一种基于卷积长短期记忆神经网络的视频损伤修复方法,步骤为:1.使用视频编解码器压缩未受损的视频码流A1,得到受损的视频码流A2;2.无损逐帧分解A1和A2,分别得到帧序列B1和B2;将B1和B2逐帧对应保存;3.使用视频编解码器提取A2的分块深度信息S1,对A2逐帧划分,将结果叠加至B2上,生成带有视频编码信息的帧序列B3;4.构建视频修复网络;5.以损失函数作为优化目标,B1为标签,将B2和B3输入视频修复网络并对其进行训练;6.将待修复的视频序列及其编码信息输入训练好的视频修复网络中,得到修复完成的视频序列;本发明所修复的受损视频清晰度高,且只针对视频受损区域进行修复。