-
公开(公告)号:CN116648716B
公开(公告)日:2025-05-02
申请号:CN202080108060.9
申请日:2020-12-24
Applicant: 华为技术有限公司
Inventor: 谢尔盖·尤里耶维奇·伊科宁 , 米哈伊尔·维亚切斯拉沃维奇·索苏尔尼科夫 , 亚历山大·亚历山德罗维奇·卡拉布托夫 , 蒂莫菲·米哈伊洛维奇·索洛维耶夫 , 王彪 , 伊蕾娜·亚历山德罗夫娜·阿尔希娜
Abstract: 本发明还涉及用于从码流中解码数据(用于静止图像或视频处理)的方法和装置。具体地,从所述码流中获取两个或多个特征图元素集。每个特征图元素集与特征图相关。然后,所述两个或多个特征图元素集中的每个分别输入多个级联层中的两个或多个特征图处理层。然后,获取用于图像或视频处理的经解码的数据,作为所述多个级联层处理的结果。因此,可以在分层结构中以高效的方式从所述码流中解码所述数据。
-
公开(公告)号:CN119893116A
公开(公告)日:2025-04-25
申请号:CN202411999888.4
申请日:2021-03-01
Applicant: 华为技术有限公司
Inventor: 塞米赫·艾森力克 , 王彪 , 阿南德·梅赫·科特拉 , 伊蕾娜·亚历山德罗夫娜·阿尔希娜
IPC: H04N19/174 , H04N19/96 , H04N19/119 , H04N19/129 , H04N19/463 , H04N19/169 , H04N19/70 , H04N19/176 , H04N19/184
Abstract: 本申请提供了一种由解码设备实现的从视频码流中解码出图像的方法。所述码流包括当前条带的条带头和表示所述当前条带的数据,所述方法包括:如果条件满足,从所述条带头中获取用于推导所述当前条带中的分块数量的参数,其中,所述条件包括:所述当前条带的条带地址不是所述当前条带所在的图像中的最后一个分块的地址;通过所述当前条带中的所述分块数量和表示所述当前条带的所述数据重建所述当前条带。
-
公开(公告)号:CN119547109A
公开(公告)日:2025-02-28
申请号:CN202480001850.5
申请日:2024-06-21
Applicant: 华为技术有限公司
Inventor: 伊蕾娜·亚历山德罗夫娜·阿尔希娜 , 蒂莫菲·米哈伊洛维奇·索洛维耶夫 , 亚历山大·亚历山德罗维奇·卡拉布托夫
IPC: G06T9/00
Abstract: 本发明涉及用于处理图像的方法、神经网络、编码器和解码器。具体地,在与下采样层具有相同功能的各层之前添加填充层,并且在与上采样层具有相同功能的各层之后添加裁剪层,以减少在神经网络中处理的数据量,从而提高译码效率。
-
公开(公告)号:CN119520802A
公开(公告)日:2025-02-25
申请号:CN202311294767.5
申请日:2023-09-28
Applicant: 华为技术有限公司
Inventor: 徐巍炜 , 余全合 , 王弋川 , 伊蕾娜·亚历山德罗夫娜·阿尔希娜
Abstract: 本申请实施例提供的一种信号处理方法,包括:获取第一基础图像、第一增益图和元数据,其中,所述第一基础图像对应第一动态范围;根据所述元数据,处理所述第一基础图像,以得到第二基础图像;根据所述第二基础图像和所述第一增益图,获得目标图像,其中,所述目标图像对应第二动态范围,所述第二动态范围与所述第一动态范围不同。本申请提供的方案能够兼容多种格式的图像编码和处理,能够在不同支持能力的系统上都获得相对较好的图像质量。
-
公开(公告)号:CN119011876A
公开(公告)日:2024-11-22
申请号:CN202410896788.2
申请日:2020-10-10
Applicant: 华为技术有限公司
Inventor: 王彪 , 塞米赫·艾森力克 , 高晗 , 阿南德·梅赫·科特拉 , 伊蕾娜·亚历山德罗夫娜·阿尔希娜
IPC: H04N19/70 , H04N19/172 , H04N19/176 , H04N19/20 , H04N19/44 , H04N19/503 , H04N19/96
Abstract: 提供一种解码设备实现的译码方法。所述方法包括解析码流,以从所述码流的图像头中获取标志,其中,所述标志表示当前图像是否为I图像。当所述标志表示所述当前图像为I图像时,为帧间预测设计的语法元素被推断为默认值;或者当所述标志表示所述当前图像为P图像或B图像时,从所述图像头中获取为帧间预测设计的语法元素。
-
公开(公告)号:CN118843871A
公开(公告)日:2024-10-25
申请号:CN202280093414.6
申请日:2022-03-14
Applicant: 华为技术有限公司
Inventor: 蒂莫菲·米哈伊洛维奇·索洛维耶夫 , 艾辛·科云朱 , 亚历山大·亚历山德罗维奇·卡拉布托夫 , 马克西姆·鲍里索维奇·西切夫 , 米哈伊尔·维亚切斯拉沃维奇·索苏尔尼科夫 , 谢尔盖·尤里耶维奇·伊科宁 , 伊蕾娜·亚历山德罗夫娜·阿尔希娜
IPC: G06N3/048 , G06N3/0495 , G06N3/0455 , G06N3/0464 , G06N3/047 , G06F7/00 , H04N19/00
Abstract: 本发明涉及一种神经网络,包括至少一个神经网络层和连接到所述至少一个神经网络层的输出的特定类型的激活函数。所述激活函数被实现为数学定义的实值非线性激活函数的近似函数,所述近似函数支持仅整数处理所述近似函数的输入值的定点表示。
-
公开(公告)号:CN118842909A
公开(公告)日:2024-10-25
申请号:CN202310956879.6
申请日:2023-07-28
Applicant: 华为技术有限公司
Inventor: 于德权 , 赵寅 , 伊蕾娜·亚历山德罗夫娜·阿尔希娜
IPC: H04N19/124 , H04N19/85 , G06T9/00
Abstract: 一种图像编码、解码方法及装置,涉及人工智能领域和图像压缩领域,用以提供一种编解码方案,以满足不同的应用场景的需求。通过本申请所提供的编码、解码方法,可以根据档次信息(或标识信息)来确定所使用的编解码网络。即编解码器可根据解码设备的能力来选择对应的档次信息,以选择或者指示不同的编解码网络,这样既可以具备适配到低算力端侧的能力,也可以具备适配需要更高算力端侧的能力。
-
公开(公告)号:CN118318446A
公开(公告)日:2024-07-09
申请号:CN202180104313.X
申请日:2021-11-16
Applicant: 华为技术有限公司
Inventor: 蒂莫菲·米哈伊洛维奇·索洛维耶夫 , 法比安·布兰德 , 尤尔根·塞勒尔 , 安德烈·考普 , 伊蕾娜·亚历山德罗夫娜·阿尔希娜
Abstract: 本申请提供了用于将图像或视频相关数据编码到码流中的方法和装置。本发明可应用于基于人工智能(artificial intelligence,AI)的视频或图像压缩技术领域,具体地,应用于基于神经网络的视频压缩技术领域。在编码过程中,神经网络(广义差)应用于信号和预测信号,以获取广义残差。在解码过程中,另一个神经网络(广义和)可以应用于重建的广义残差和预测信号,以获取重建信号。
-
公开(公告)号:CN118250472A
公开(公告)日:2024-06-25
申请号:CN202410404519.X
申请日:2021-01-13
Applicant: 华为技术有限公司
Inventor: 阿列克谢·康斯坦丁诺维奇·菲利波夫 , 瓦西里·亚历斯维奇·拉夫特斯基 , 伊蕾娜·亚历山德罗夫娜·阿尔希娜
IPC: H04N19/52 , H04N19/119 , H04N19/46 , H04N19/44 , H04N19/70 , H04N19/176 , H04N19/184
Abstract: 本发明公开了一种获取用于视频解码的几何划分融合模式候选的最大数量的方法和一种视频解码装置。所述方法包括:获取视频序列的码流;根据所述码流获取第一指示符的值,其中,所述第一指示符表示融合运动矢量预测(motion vector prediction,MVP)候选的最大数量;根据所述码流获取第二指示符的值,其中,所述第二指示符表示是否对所述视频序列启用基于几何划分的运动补偿;当所述第一指示符的值大于阈值且所述第二指示符的值等于预设值时,从所述码流中解析第三指示符的值,其中,所述第三指示符表示从所述第一指示符的值中减去几何划分融合模式候选的最大数量。
-
公开(公告)号:CN118160305A
公开(公告)日:2024-06-07
申请号:CN202280070788.6
申请日:2022-07-15
Applicant: 华为技术有限公司
Inventor: 阿赫迈特·布拉汗·科云朱 , 阿塔纳斯·波夫 , 伊蕾娜·亚历山德罗夫娜·阿尔希娜
IPC: H04N19/119 , H04N19/13 , H04N19/91 , G06N3/0464 , G06N3/084 , G06N7/01
Abstract: 本发明描述了用于对潜在张量进行熵编码和熵解码的方法和装置。所述方法包括:在空间维度和信道维度中将所述潜在张量分离为分段,其中,每个分段包括至少一个潜在张量元素;通过神经网络处理所述分段的布置,其中,所述神经网络包括至少一个注意力层;根据所述处理的分段,获取用于对潜在张量元素进行熵编码或熵解码的概率模型。
-
-
-
-
-
-
-
-
-