-
公开(公告)号:CN118556398A
公开(公告)日:2024-08-27
申请号:CN202280089142.2
申请日:2022-11-17
申请人: 韩国电子通信研究院 , 韩国航空大学校产学协力团
IPC分类号: H04N19/513 , H04N19/119 , H04N19/176 , H04N19/124 , H04N19/129 , H04N19/109 , H04N19/105 , H04N19/132 , G06N20/00
摘要: 本文公开了一种用于图像编码/解码的方法、设备和存储介质。在用于图像编码/解码方法中,导出目标块的帧内预测模式,并且配置用于帧内预测的参考样点。使用导出的帧内预测模式和配置的参考样点来执行对目标块的帧内预测。在导出帧内预测模式时,可使用基于机器学习的帧内预测模式导出方法。在帧内预测中,可使用基于机器学习的预测、预测样点混合、预测样点细化和预测样点缩放。
-
公开(公告)号:CN118592028A
公开(公告)日:2024-09-03
申请号:CN202280079131.6
申请日:2022-09-29
申请人: 韩国电子通信研究院
IPC分类号: H04N19/57 , H04N19/577 , H04N19/119 , H04N19/132 , H04N19/124 , H04N19/60 , H04N19/105 , H04N19/129 , H04N19/109 , H04N19/513
摘要: 本文公开了一种用于图像编码/解码的方法、设备和存储介质。在典型的图像编码/解码方法中,可有限地使用解码器侧运动信息导出方法。因此,可归因于解码器侧运动信息导出方法的编码效率的提高也可能受到限制。在实施例中,公开了一种在帧间预测中使用的运动信息搜索方法。通过使用各种运动搜索方法,可提高帧间预测中的编码效率。
-
公开(公告)号:CN110970041A
公开(公告)日:2020-04-07
申请号:CN201911108867.8
申请日:2015-07-01
申请人: 韩国电子通信研究院
IPC分类号: G10L19/008 , G10L19/02
摘要: 公开了一种处理多信道音频信号的方法和装置。所述方法包括:识别从N信道的输入信号生成的N/2信道的下混信号和N/2残余信号;通过将N/2信道的下混信号和N/2残余信号应用到预去相关器矩阵来生成第一信号;通过将N/2信道的下混信号和N/2残余信号应用到预去相关器矩阵来生成第二信号;通过将第一信号和第二信号应用到混合矩阵来输出N信道的输出信号,其中,在应用混合矩阵之前,没有通过去相关器对第一信号进行去相关,并且在应用混合矩阵之前,通过去相关器对第二信号进行去相关。
-
公开(公告)号:CN110895943A
公开(公告)日:2020-03-20
申请号:CN201911107604.5
申请日:2015-07-01
申请人: 韩国电子通信研究院
IPC分类号: G10L19/008
摘要: 公开了一种处理多信道音频信号的方法和装置。所述方法包括:识别从N信道的输入信号生成的N/2信道的下混信号和N/2残余信号;通过将N/2信道的下混信号和N/2残余信号应用到预去相关器矩阵来生成第一信号和第二信号;将第一信号应用到混合矩阵,其中不基于去相关器对第一信号进行去相关;将第二信号应用到去相关器并且将去相关的第二信号应用到混合矩阵;以及基于将第一信号和去相关的第二信号应用到混合矩阵的结果,输出N信道的输出信号。
-
公开(公告)号:CN104282313B
公开(公告)日:2018-09-21
申请号:CN201410524905.9
申请日:2009-11-26
IPC分类号: G10L19/22
摘要: 本发明提出了一种以模式转换为基础来处理窗口序列的语音/音频统合编解码器。当语音/音频统合编解码器发生模式转换时,可以折点为基准执行帧之间的重叠来编码或解码。语音/音频统合编解码器为执行编码或解码,根据情况处理不同的窗口序列,从而可提高译码的性能。
-
公开(公告)号:CN104299618A
公开(公告)日:2015-01-21
申请号:CN201410479883.9
申请日:2009-07-14
申请人: 韩国电子通信研究院 , 光云大学校产学协力团
IPC分类号: G10L19/20
CPC分类号: G10L19/12 , G10L19/008 , G10L19/02 , G10L19/20 , G10L19/22 , G11C2207/16
摘要: 本发明提供了一种用于统合地编码和解码语音信号(speech signal)和音频信号(audio signal)的设备与方法。所述编码设备(100)可包括:输入信号分析器(110),其分析输入信号的特征;第一转换编码器(120),当输入信号是音频特征信号时,其将输入信号转换成频域信号,并将输入信号编码;线性预测编码(LPC:Linear Predictive Coding)编码器(130),当输入信号是语音特征信号时,其执行输入信号的LPC编码;和比特流生成器(140),其使用第一转换编码器(120)的输出信号和LPC编码器(130)的输出信号,来生成比特流。
-
公开(公告)号:CN102883257A
公开(公告)日:2013-01-16
申请号:CN201210381376.2
申请日:2007-12-27
申请人: 韩国电子通信研究院
IPC分类号: H04S7/00
CPC分类号: G10L19/008 , G10L19/0017 , G10L19/173 , H04S3/002 , H04S7/30 , H04S2400/11 , H04S2420/03
摘要: 本发明提供了一种用于编码和解码具有各种声道的多对象音频信号的设备和方法,所述设备和方法提供了与传统的空间音频编码(SAC)比特流的后向兼容性。所述设备包括:音频对象编码单元,用于基于空间线索来编码输入到编码设备的音频对象信号,并创建用于编码后的音频对象信号的渲染信息,其中所述渲染信息提供了包括用于音频对象信号的空间线索信息、音频对象信号的声道信息和音频对象信号的标识信息的编码设备,并且所述编码设备使用在音频信号的编码和解码中。
-
公开(公告)号:CN102768835A
公开(公告)日:2012-11-07
申请号:CN201210227837.0
申请日:2007-10-01
申请人: 韩国电子通信研究院
CPC分类号: G10L19/00 , G10L19/008 , G10L19/20
摘要: 提供了一种用于编码和解码多对象音频信号的设备和方法。该设备包括:缩混器,用于将音频信号缩混为一个缩混后的音频信号,并提取用于所述音频信号中的每一个的包括报头信息和空间线索信息的补充信息;编码器,用于对缩混后的音频信号进行编码;和补充信息编码器,用于生成该补充信息作为比特流。该报头信息包括用于所述音频信号中的每一个的标识信息和用于所述音频信号的声道信息。
-
公开(公告)号:CN102388607A
公开(公告)日:2012-03-21
申请号:CN200980155342.8
申请日:2009-11-26
申请人: 韩国电子通信研究院 , 光云大学校产学协力团
IPC分类号: H04N7/12
CPC分类号: G10L19/22 , G10L19/022 , G10L19/20
摘要: 本发明提出了一种以模式转换为基础来处理窗口序列的语音/音频统合编解码器。当语音/音频统合编解码器发生模式转换时,可以折点为基准执行帧之间的重叠来编码或解码。语音/音频统合编解码器为执行编码或解码,根据情况处理不同的窗口序列,从而可提高译码的性能。
-
公开(公告)号:CN102216982A
公开(公告)日:2011-10-12
申请号:CN200980145832.X
申请日:2009-09-18
申请人: 韩国电子通信研究院 , 光云大学校产学协力团
CPC分类号: G10L19/0212
摘要: 本发明提供了在基于MDCT的译码器(205)和异质译码器(204)之间转换的编码设备(101)和解码设备。当在基于MDCT的译码器(205)和异质译码器(204)之间发生交换时,所述编码设备(101)可编码附加信息以还原根据基于MDCT的译码方式编码的输入信号。由此,能够防止生成不必要的比特流,且可编码最小限度的附加信息。
-
-
-
-
-
-
-
-
-