-
公开(公告)号:CN118898997A
公开(公告)日:2024-11-05
申请号:CN202411227461.2
申请日:2018-03-19
申请人: 杜比国际公司
IPC分类号: G10L19/24 , G10L19/22 , G10L19/02 , G10L21/038 , G10L19/26 , G06F17/10 , G10L19/008
摘要: 本申请涉及用于音频信号的高频重建的谐波转置器的后向兼容集成。本申请揭示一种用于解码经编码音频位流的方法。所述方法包含接收所述经编码音频位流,及解码音频数据以产生经解码低带音频信号。所述方法进一步包含提取高频重建元数据,及使用分析滤波器组对所述经解码低带音频信号进行滤波以产生经滤波低带音频信号。所述方法还包含提取指示将对所述音频数据执行频谱变换还是谐波转置的旗标,及根据所述旗标使用所述经滤波低带音频信号及所述高频重建元数据再生所述音频信号的高带部分。
-
公开(公告)号:CN118800245A
公开(公告)日:2024-10-18
申请号:CN202411106496.0
申请日:2019-12-10
申请人: 微软技术许可有限责任公司
IPC分类号: G10L19/00 , G10L19/02 , G10L19/08 , G10L19/125 , G10L19/26 , G10L21/038 , G10L21/0388 , G10L25/12 , G10L25/69 , G10L25/72
摘要: 描述了在语音编码期间相位量化和在语音解码期间相位重构的创新。例如,为了编码相位值的集合,语音编码器会省略较高频相位值和/或将至少一些相位值表示为基函数的加权和。或者,作为另一示例,为了解码相位值的集合,语音解码器使用基函数的加权和来重构至少一些相位值和/或重构较低频相位值,然后使用至少一些较低频相位值来合成较高频相位值。在许多情况下,这些创新提高了在低比特率场景中语音编解码器的性能,即使当编码的数据通过经受带宽不足或传输质量问题的网络进行传输时也是如此。
-
公开(公告)号:CN112863527B
公开(公告)日:2024-09-17
申请号:CN202110086185.2
申请日:2018-03-19
申请人: 杜比国际公司
IPC分类号: G10L19/24 , G10L19/22 , G10L19/02 , G10L19/008 , G06F17/10 , G10L19/26 , G10L21/038
摘要: 本申请涉及用于音频信号的高频重建的谐波转置器的后向兼容集成。本申请揭示一种用于解码经编码音频位流的方法。所述方法包含接收所述经编码音频位流,及解码音频数据以产生经解码低带音频信号。所述方法进一步包含提取高频重建元数据,及使用分析滤波器组对所述经解码低带音频信号进行滤波以产生经滤波低带音频信号。所述方法还包含提取指示将对所述音频数据执行频谱变换还是谐波转置的旗标,及根据所述旗标使用所述经滤波低带音频信号及所述高频重建元数据再生所述音频信号的高带部分。
-
公开(公告)号:CN112951248B
公开(公告)日:2024-05-07
申请号:CN202110178110.7
申请日:2016-03-07
申请人: 弗劳恩霍夫应用研究促进协会
IPC分类号: G10L19/008 , G10L19/02 , G10L19/04 , G10L19/18 , G10L21/038
摘要: 展示用于编码多声道信号(4)的音频编码器(2”)。音频编码器包括用于对多声道信号(4)进行降混以获得降混信号(14)的降混频器(12);用于对降混信号(14)进行编码的线性预测域核心编码器(16),其中降混信号(14)具有低频带和高频带,其中线性预测域核心编码器(16)用于施加用于对高频带进行参数化编码的带宽扩展处理;用于生成多声道信号(4)的频谱表示的滤波器组(82);以及用于处理包括多声道信号的低频带和高频带的频谱表示以生成多声道信息(20)的联合多声道编码器(18)。
-
公开(公告)号:CN112634913B
公开(公告)日:2024-04-09
申请号:CN202110018176.X
申请日:2016-03-07
申请人: 弗劳恩霍夫应用研究促进协会
IPC分类号: G10L19/008 , G10L19/02 , G10L19/04 , G10L19/18 , G10L21/038
摘要: 展示用于编码多声道音频信号(4)的音频编码器(2)的示意性框图。音频编码器包括线性预测域编码器(6)、频域编码器(8)以及用于在线性预测域编码器(6)与频域编码器(8)之间切换的控制器(10)。控制器被配置为使得多声道信号的部分由线性预测域编码器的编码帧表示或由频域编码器的编码帧表示。线性预测域编码器包括用于对多声道信号(4)进行降混以获得降混信号(14)的降混频器(12)。线性预测域编码器还包括用于编码降混信号的线性预测域核心编码器(16),此外,线性预测域编码器包括用于从多声道信号(4)生成第一多声道信息(20)的第一联合多声道编码器(18)。
-
公开(公告)号:CN111418012B
公开(公告)日:2024-03-15
申请号:CN201880078921.6
申请日:2018-12-05
申请人: 辛纳普蒂克斯公司
发明人: F.P.D.穆斯蒂埃 , F.内斯塔
IPC分类号: G10L21/0232 , G10L21/038 , G10L25/21 , G10L25/84 , G10L15/22 , G10L15/20 , H04R1/40
摘要: 一种实时音频信号处理系统包括音频信号处理器,所述音频信号处理器配置为使用修改的广义特征值(GEV)波束成形技术来处理音频信号以生成增强的目标音频输出信号。数字信号处理器包括子带分解电路和目标活动检测器,所述子带分解电路配置为将音频信号分解为频域中的子带帧,所述目标活动检测器配置为检测目标音频是否存在于该子带帧中。基于与该子带帧相关的信息和该目标音频是否存在于该子带帧中的确定,数字信号处理器配置为使用修改的GEV技术来估计目标音频源的相对传递函数(RTF),并且基于估计的RTF生成滤波器。然后可以将滤波器应用于音频信号以生成增强的音频输出信号。
-
公开(公告)号:CN117316168A
公开(公告)日:2023-12-29
申请号:CN202311134080.5
申请日:2017-04-06
申请人: 弗劳恩霍夫应用研究促进协会
IPC分类号: G10L19/02 , G10L19/028 , G10L19/03 , G10L19/032 , G10L19/04 , G10L19/06 , G10L19/12 , G10L19/16 , G10L19/26 , G10L21/007 , G10L21/02 , G10L21/0208 , G10L21/0324 , G10L21/038 , G10L25/15 , G10L25/18
摘要: 一种用于对具有下频带和上频带的音频信号进行编码的音频编码器,包括:检测器(802),用于检测该音频信号的上频带中的尖峰频谱区域;整形器(804),用于使用下频带的整形信息来对该下频带进行整形,并且用于使用该下频带的整形信息的至少一部分来对上频带进行整形,其中,该整形器(804)被配置为额外地衰减上频带中的检测到的尖峰频谱区域中的频谱值;以及量化器和编码器级(806),用于对经整形的下频带和经整形的上频带进行量化,并且用于对来自该经整形的下频带和该经整形的上频带的经量化的频谱值进行熵编码。
-
公开(公告)号:CN117292699A
公开(公告)日:2023-12-26
申请号:CN202210693082.7
申请日:2022-06-17
申请人: 华为技术有限公司
IPC分类号: G10L21/02 , G10L21/0232 , G10L21/038
摘要: 本申请公开了一种音频的带宽扩展方法、装置、存储介质及计算机程序产品,属于音频处理技术领域。本方案通过超分网络所扩展出的高频成分使得最终音频的听感更加和谐自然,且复杂度更低,提高了带宽扩展效率。另外,本方案将超分网络与高通滤波相结合,高通滤波参数是根据待进行带宽扩展的音频信号的截止频率确定的,可见本方案能够自适应不同的截止频率,超分网络也能够处理各种截止频率的音频信号。在待进行带宽扩展的音频信号是解码过程中所得到的音频信号的情况下,由于截止频率与码率相关,因此,本方案能够自适应不同的码率。此外,本方案通过高通滤波使得最终音频信号的低频成分基本不变,即低频成分不受损。
-
公开(公告)号:CN112309422B
公开(公告)日:2023-11-21
申请号:CN202011194703.4
申请日:2015-07-21
申请人: 弗劳恩霍夫应用研究促进协会
IPC分类号: G10L21/0232 , G10L21/0216 , G10L21/038 , G10L25/03 , G10L25/21 , G10L19/26 , G10L19/025 , G10L19/02 , G10L19/012
-
公开(公告)号:CN110853667B
公开(公告)日:2023-10-27
申请号:CN201910955621.8
申请日:2014-01-28
申请人: 弗劳恩霍夫应用研究促进协会
发明人: 萨沙·迪施 , 克里斯蒂安·赫尔姆里希 , 马库斯·穆赖特鲁斯 , 马库斯·施内尔 , 阿瑟·特里特哈特
IPC分类号: G10L21/038 , G10L19/025 , G10L19/24
摘要: 本公开涉及音频编码器。该基于输入音频信息提供编码音频信息的音频编码器,包括:带宽扩展信息提供器,配置为使用可变时间分辨率提供带宽扩展信息,及侦测器,配置为侦测摩擦音或破擦音的起始段。音频编码器配置为调整带宽扩展信息提供器所使用的时间分辨率,以使得至少针对侦测到摩擦音或破擦音的起始段的时间的之前的预定时间周期及针对侦测到摩擦音或破擦音的起始段的时间的之后的预定时间周期,以提高的时间分辨率提供带宽扩展信息。可选地或者此外,响应于侦测到摩擦音或破擦音的终止段,以提高的时间分辨率提供带宽扩展信息。音频编码器及方法使用对应的概念。
-
-
-
-
-
-
-
-
-