-
公开(公告)号:CN118890479A
公开(公告)日:2024-11-01
申请号:CN202410918054.X
申请日:2024-07-10
申请人: 上海交通大学
IPC分类号: H04N19/147 , H04N19/567 , H04N19/42 , H04N21/462 , H04N21/647 , H04N19/172
摘要: 本公开提供一种基于神经网络的帧级复杂度控制方法及系统,其中,基于神经网络的帧级复杂度控制方法,包括:根据预设的实用编码器的序列级预设配置,确定帧级预设配置;根据帧级预设配置,确定训练数据集;确定训练完成的帧级预设配置预测网络;将待编码的视频输入训练完成的帧级预设配置预测网络,确定待编码的视频的每一帧对应的帧级预设配置;设置一个可选时间参数;根据预设的复杂度分配机制、待编码的视频的每一帧对应的帧级预设配置和可选时间参数,对待编码视频进行编码处理,确定复杂度控制误差。通过本公开,引入复杂度分配和反馈设计,实时监控并控制复杂度控制流程,在低延迟场景的实用编码器上实现较高的复杂度控制精度。
-
公开(公告)号:CN118870000A
公开(公告)日:2024-10-29
申请号:CN202410811787.3
申请日:2024-06-21
申请人: 北京邮电大学
IPC分类号: H04N19/147 , H04N19/149 , H04N19/172 , H04N19/124 , G06N3/126
摘要: 本发明提供一种视频编码码率控制优化方法和系统,所述方法包括:设置预设长度滑动窗口从前向后逐帧提取视频帧序列,利用预设码率控制算法计算前端预设长度帧的预估码率并编码。对预设长度帧之后视频帧,获取窗口内已编码帧和待编码当前帧的直方图,计算直方图之间距离,调用遗传算法,以窗口内每个已编码帧对应的编码参数为种群基因,利用待编码帧与每个已编码帧的直方图距离计算待编码帧的编码失真率和预估码率以计算种群中个体的适应度,对种群进行选择、杂交和变异进行迭代,筛选每次迭代中适应度最大的个体获得每次迭代中最佳预估码率以结合得到最终预估码率,根据最终预估码率对待编码当前帧进行编码。本发明能够提升码率控制精度和视频质量。
-
公开(公告)号:CN118803272A
公开(公告)日:2024-10-18
申请号:CN202310415904.X
申请日:2023-04-13
申请人: 浙江大华技术股份有限公司
IPC分类号: H04N19/593 , H04N19/117 , H04N19/147 , H04N19/11 , H04N19/105 , H04N19/42
摘要: 本申请公开了一种帧内滤波预测方法、视频编码方法、视频解码方法及装置。该帧内滤波预测方法包括:基于当前块所属图像中的预设搜索范围搜索出当前块的至少一个匹配块;利用当前块的当前模板和参考模板求解出至少一个滤波模型的参数;通过至少一个所述滤波模型,对所述匹配块中每一像素的梯度进行运算,和/或,对所述当前块中对应像素的位置信息进行运算,得到所述当前块中对应像素的预测值,以得到当前块的预测块。本申请可以提高预测的准确性。
-
公开(公告)号:CN118764644A
公开(公告)日:2024-10-11
申请号:CN202410972632.8
申请日:2024-07-19
申请人: 清华大学
IPC分类号: H04N19/61 , H04N19/147 , H04N19/119 , G06T9/00 , G06N3/08
摘要: 本发明提供一种基于语义增强的HEVC编码方法和装置,包括:获取原始编码和待编码视频;将所述待编码视频的图像帧依次输入至预先训练的CTU分割结果预测模型,得到CTU分割预测结果;根据所述原始编码对所述待编码视频进行编码;根据所述CTU分割预测结果执行所述编码过程中的率失真优化过程,得到目标编码;其中,所述CTU分割结果预测模型是基于深度神经网络利用海量视频文件样本训练得到的。本发明使用深度神经网络提取语义信息以预测CTU分割结果,根据神经网络的预测结果优化率失真优化遍历过程,从而优化编码方法,在不改变编码性能的同时节约编码时间。同时由于本发明与现有代码进行了结合,节约了部署成本。
-
公开(公告)号:CN114040210B
公开(公告)日:2024-10-11
申请号:CN202111254764.X
申请日:2021-10-27
申请人: 中山大学
IPC分类号: H04N19/593 , H04N19/119 , H04N19/147 , H04N19/96
摘要: 本发明公开了一种基于AVS3的帧内CU快速划分方法,方法包括:通过父编码单元根据约束条件确定所有可选划分方式;基于拉东算法和Sobel算子,从所述可选划分方式中选取目标划分方式进行编码单元快速划分;遍历所有可选划分方式,递归计算每种划分方式对应的率失真优化代价;将所述率失真优化代价最小时对应的可选划分方式作为最佳划分方式;根据所述最佳划分方式对父编码单元进行划分。本发明的编码时间短且编码损失相对稳定,可广泛应用于音视频编码技术领域。
-
公开(公告)号:CN113497938B
公开(公告)日:2024-10-11
申请号:CN202010196440.4
申请日:2020-03-19
申请人: 华为云计算技术有限公司
IPC分类号: H04N19/42 , H04N19/44 , H04N19/136 , H04N19/124 , H04N19/147 , H04N19/91 , G06T9/00
摘要: 本申请提供了一种训练VAE的方法,该方法包括:获取训练图像;在所述训练图像中添加第一噪声,得到加噪训练图像;通过所述加噪训练图像训练变分自编码器,所述变分自编码器用于对所述加噪训练图像进行压缩和解压。在训练图像中添加第一噪声相当于对训练图像的像素分布进行了扰动,由于第一噪声的特征是已知的,VAE能够利用被扰动的像素周围的全局上下文信息进行编码,提高低码率下训练图像的信息利用率,因此,通过加噪训练图像训练VAE能够提高VAE的性能,从而提高解码图像的保真度。此外,采用加噪训练图像训练VAE能够提高VAE的特征提取功能的鲁棒性,当使用噪声信道传输码流时,能够提高解码图像的保真度。
-
公开(公告)号:CN111866507B
公开(公告)日:2024-09-27
申请号:CN202010509322.4
申请日:2020-06-07
申请人: 咪咕文化科技有限公司 , 北京大学 , 中国移动通信集团有限公司
IPC分类号: H04N19/147 , H04N19/186 , H04N19/82 , H04N19/86
摘要: 本发明提供一种图像滤波方法、装置、设备及可读存储介质,解决现有帧图像的编码质量低的问题。本发明的方法包括:获取M个分类集合以及每个分类集合对应的滤波参数;其中,所述分类集合是根据预设分类方式对当前帧的所有像素进行分类获得的;所述当前帧为当前编码帧或当前解码帧;对每个像素,按照其所属分类集合对应的滤波参数进行滤波;所述预设分类方式包括以下方式中的至少一者:基于像素本身大小的分类方式;基于像素及与其相邻的L个像素间的关系的分类方式,M、L均为正整数。如此,按照上述预设分类方式得到的每个分类集合对应的滤波系数,利用该滤波系数对当前帧进行编解码,能够提高整帧图像的编解码质量。
-
公开(公告)号:CN118694948A
公开(公告)日:2024-09-24
申请号:CN202410825222.0
申请日:2024-06-25
申请人: 北京中星微人工智能芯片技术有限公司 , 中星微技术股份有限公司
IPC分类号: H04N19/176 , H04N19/91 , H04N19/124 , H04N19/50 , H04N19/147 , H04N19/154
摘要: 本公开的实施例公开了视频编码方法、装置、电子设备和可读介质。该方法的一具体实施方式包括:获取待编码视频图像序列;对于每个待编码视频图像,执行以下视频图像编码信息生成步骤:对待编码视频图像进行块划分处理,得到编码单元序列;对于每个编码单元,执行以下步骤:确定初始编码方法信息和初始重建图像;对初始重建图像进行视觉感知质量检测,得到图像质量分值;基于预设量化参数调整步长和图像质量分值,对初始编码方法信息进行更新处理,得到目标编码方法信息;对编码单元进行预测编码处理,得到图像块编码结果;对各个图像块编码结果进行熵编码处理,得到视频图像编码信息;生成视频编码信息。该实施方式可以提高视频的压缩效率。
-
公开(公告)号:CN113767400B
公开(公告)日:2024-09-24
申请号:CN201980095978.1
申请日:2019-03-21
申请人: 谷歌有限责任公司
IPC分类号: G06N3/0464 , G06N3/045 , G06N3/09 , H04N19/119 , H04N19/147 , H04N19/172 , H04N19/176 , G06T9/00
摘要: 一种用于对图像块进行编码的装置,其包括处理器,其将图像块呈现给机器学习模型,从模型获得用于对图像块进行编码的分割决策,并且使用分割决策对图像块进行编码。模型被训练以输出分割决策,用于使用多个训练块的训练数据作为输入对图像块进行编码,训练数据包括:对于训练块,用于对训练块进行编码的分割决策以及对于每个分割决策,从使用分割决策对训练块进行编码而产生的率失真值。模型是使用损失函数来训练的,损失函数将以下组合:基于分割决策与相应预测分割之间的关系的分割损失函数和基于率失真值与相应预测率失真值之间的关系的率失真成本损失函数。
-
公开(公告)号:CN118678068A
公开(公告)日:2024-09-20
申请号:CN202310293622.7
申请日:2023-03-15
申请人: 腾讯科技(深圳)有限公司
发明人: 张佳
IPC分类号: H04N19/114 , H04N19/146 , H04N19/147 , H04N19/436
摘要: 本申请实施例公开了一种视频编码方法、装置、电子设备及存储介质,通过基于多个预编码器对目标视频片段进行码率恒定的编码处理,进而确定各个预编码器的编码性能参数,根据编码性能参数从多个候选画面组结构中确定目标画面组结构,此时得到的目标画面组结构为多个候选画面组结构中率失真性能最好的画面组结构,从而达到画面组结构的筛选匹配效果,进而将目标画面组结构发送至目标编码器进行配置后对目标视频片段进行编码处理,即便是针对不同特性、不同场景的目标视频片段进行视频编码时,均可以自适应地选择合适的目标画面组结构,从而能够有效地提升视频编码时的率失真性能,可以广泛应用于云技术、视频处理等技术领域。
-
-
-
-
-
-
-
-
-