用于基于神经的媒体压缩的熵译码

    公开(公告)号:CN118872279A

    公开(公告)日:2024-10-29

    申请号:CN202380020127.7

    申请日:2023-01-11

    摘要: 本公开描述了用于使用基于神经的技术译码的媒体数据的熵译码技术。媒体译码器被配置为:确定通过基于神经的媒体压缩技术译码的数据流的数据元素的概率分布函数参数,其中所述概率分布函数参数是所述数据流的概率分布函数的标准偏差的对数函数;基于所述概率分布函数参数来确定码向量;以及使用所述码向量对所述数据元素进行熵译码。

    用于不可分开转换的存储器减少

    公开(公告)号:CN110800300B

    公开(公告)日:2024-06-07

    申请号:CN201880039839.2

    申请日:2018-06-28

    摘要: 本发明描述以下技术:其中解码器经配置以接收输入数据块及将逆向不可分开转换应用于至少部分所述输入数据块以产生逆向不可分开转换输出系数块。所述应用所述逆向不可分开转换包括指派窗口、为所述经指派窗口内部的各位置指派权重,及基于所述经指派权重确定所述逆向不可分开转换输出系数块。所述解码器进一步经配置以基于所述经确定逆向不可分开转换输出系数块形成经解码视频块,其中形成所述经解码视频块包括对所述残余视频块与一或多个预测性块求和。

    用于学习的视频压缩的多尺度光流

    公开(公告)号:CN116982311A

    公开(公告)日:2023-10-31

    申请号:CN202280020968.3

    申请日:2022-02-18

    IPC分类号: H04N19/00

    摘要: 描述了基于应用可变尺度扭曲的运动估计对数据进行编码和/或解码的系统和技术。编码设备可以接收输入帧和参考帧,其描述不同时间的场景。编码设备可以生成光流,该光流识别两个帧之间的场景中的移动。编码设备可以生成加权图,该加权图识别参考帧在输入帧预测时所进行的扭曲是如何精细或粗糙。编码设备可以基于光流和加权图生成经编码的视频数据。解码设备可以从经编码的数据生成经重构的光流和经重构的加权图。解码设备可以通过基于经重构的光流和经重构的加权图对参考帧进行扭曲,而生成预测帧。解码设备可以基于预测帧生成经重构的输入帧。

    针对视频译码的概率初始化

    公开(公告)号:CN113632491A

    公开(公告)日:2021-11-09

    申请号:CN202080020348.0

    申请日:2020-03-12

    IPC分类号: H04N19/91 H04N19/70

    摘要: 一种用于对视频数据进行熵解码的示例方法包括:检索用于在对用于视频数据的可独立译码单元的语法元素的值进行熵译码的上下文自适应熵译码过程中使用的多个上下文中的上下文的预定义的初始化值;基于预定义的初始化值并且在线性域中确定上下文的初始概率状态;以及从比特流中并且基于上下文的初始概率状态来对用于语法元素的值的仓进行熵解码。

    用于并行熵译码中的比特流索引的压缩

    公开(公告)号:CN116746147A

    公开(公告)日:2023-09-12

    申请号:CN202280010880.3

    申请日:2022-01-07

    发明人: A·赛义德

    IPC分类号: H04N19/119

    摘要: 本文描述了用于视频译码的技术,包括用于基于神经网络的视频译码和/或并行熵译码的比特流索引的压缩。一个示例包括:获得视频数据序列;识别视频数据序列中的与用于可并行熵译码视频数据序列的可单独熵译码包的入口点相关联的位置;以及生成可并行熵译码视频数据序列。然后,生成可并行熵译码视频数据序列的索引,该索引标识可并行熵译码视频数据序列内的可单独熵译码包。

    通过参数化概率估计有限状态机进行二进制算术译码

    公开(公告)号:CN110419216B

    公开(公告)日:2021-12-17

    申请号:CN201880018647.3

    申请日:2018-03-22

    摘要: 对于二进制元素流的至少一个相应二进制元素,解码器可以基于所述相应二进制元素的状态、所述相应二进制元素的间隔及偏移值,确定所述相应二进制元素的值。另外,所述解码器确定用于所述二进制元素流的下一个二进制元素的一或多个有限状态机FSM参数。用于所述下一个二进制元素的所述一或多个FSM参数控制根据所述相应二进制元素的状态计算所述下一个二进制元素的概率估计值的方式。所述解码器使用参数化状态更新函数来确定所述二进制元素流的所述下一个二进制元素的状态,所述参数化状态更新函数将所述相应二进制元素的所述状态、用于所述二进制元素流的所述下一个二进制元素的所述一或多个FSM参数以及所述相应二进制元素的所述值作为输入。所述解码器可将所述二进制元素流多值化以形成经解码语法元素。

    使用优化的紧凑多遍变换的高效变换编码

    公开(公告)号:CN108702517B

    公开(公告)日:2020-12-15

    申请号:CN201780010399.3

    申请日:2017-02-15

    IPC分类号: H04N19/60 H04N19/42

    摘要: 作为视频编码或解码过程的部分,一种装置将变换应用于输入数据元素以导出用于当前块的输出数据元素。所述变换包括向量变换序列。对于所述向量变换序列中除所述向量变换序列中的第一向量变换外的每一相应的向量变换,所述相应的向量变换的输入值包括所述向量变换序列中的相应的前一向量变换的输出值。所述向量变换序列中的每一相应的向量变换进一步将用于所述相应的向量变换的相应的参数向量作为输入,用于所述相应的向量变换的所述相应的参数向量包括一或多个参数。

    在视频译码中与位置相关的预测组合

    公开(公告)号:CN111183645A

    公开(公告)日:2020-05-19

    申请号:CN201880064834.5

    申请日:2018-10-09

    摘要: 一种视频译码器可使用帧内预测模式产生预测块。作为产生所述预测块的部分,所述视频译码器可针对所述预测块中的样本集合中的每一相应样本,基于第一权重的初始值及所述相应样本与所述预测块的第一边界之间的距离确定所述相应样本的第一权重的值。另外,所述视频译码器可基于第二权重的初始值及所述相应样本与所述预测块的第二边界之间的距离确定所述相应样本的第二权重的值。所述视频译码器还可确定所述相应样本的主值。所述视频译码器随后可基于第一权重、第二权重及所述主值确定所述相应样本的辅值。