-
公开(公告)号:CN106463121B
公开(公告)日:2019-07-05
申请号:CN201580025867.5
申请日:2015-05-15
申请人: 高通股份有限公司
发明人: 金墨永
IPC分类号: G10L19/002 , G10L19/008 , H04S3/00
CPC分类号: G10L19/008 , G10L19/002 , H04S3/008 , H04S2420/11
摘要: 本发明大体上揭示用于音频数据的压缩和解码的系统和技术。用于压缩表示声场的较高阶立体混响HOA系数的实例装置包含:存储器,其经配置以存储音频数据;以及一或多个处理器,其经配置以:基于一或多个奇异值确定何时使用所述HOA系数中的环境HOA系数来增强通过所述HOA系数的分解获得的一或多个前景音频对象,所述一或多个奇异值也是通过所述HOA系数的所述分解获得,所述环境HOA系数表示所述声场的环境分量。
-
公开(公告)号:CN109791768A
公开(公告)日:2019-05-21
申请号:CN201780051834.7
申请日:2017-09-28
申请人: 冠状编码股份有限公司
IPC分类号: G10L19/008 , H04S3/02 , H04S5/02
CPC分类号: G10L19/008 , H04S3/02 , H04S5/02 , H04S2400/03 , H04S2420/01 , H04S2420/11
摘要: 本发明题为“用于对三维音频信号进行转换、立体声编码、解码和转码的过程”。本发明涉及对声学场、更具体地讲是一阶高保真度立体声响复制三维声学场进行转换、编码、解码和转码的方法,包括至少一种用于将所述声学场转换成球形场的方法、用于将所述球形场编码成立体声信号的方法、用于将立体声信号解码到球形场中的方法、或者用于将所述球形场转码成任何音频格式的方法。用于将高保真度立体声响复制声学场编码成球形场的方法在频域中执行将所述声学场分成三个分量,任选地分成两个分量,并且将所述分量分组到全球形场中。用于将所述球形场编码成立体声信号的方法在频域中执行全景和相位差值的确定、通道间域中相位差奇点的确定、通道间域中相位对应函数的确定、以及立体声形式的经编码信号的左分量和右分量的计算。球坐标任选地以仿射方式修改,以对应于左通道和右通道的标准几何布置。用于在球形场中解码的方法适用于任何立体声信号,尤其适用于通过所述编码方法获得的立体声信号。所述用于在球形场中解码的方法在频域中执行全景和相位差的确定;通道间域中相位差奇点的新位置的确定,所述位置随时间而变化;通道间域中相位对应函数的确定;对应于所期望球形场的复系数的确定;和所述球形场中原点方向的确定,所述方向任选地以仿射方式修改以对应于左通道和右通道的标准几何布置。所述用于从立体声信号进行转码的方法包括所述用于解码到球形场中的方法,然后包括提供球形场到给定音频全景定律上的投影的方法、或双耳化方法。
-
公开(公告)号:CN109036441A
公开(公告)日:2018-12-18
申请号:CN201811253730.7
申请日:2015-03-24
申请人: 杜比国际公司
IPC分类号: G10L19/008 , H04S3/00
CPC分类号: H04S3/008 , G10L19/008 , H04S3/02 , H04S2420/01 , H04S2420/11
摘要: 本公开涉及对高阶高保真立体声信号应用动态范围压缩的方法和设备。动态范围压缩(DRC)不能被简单地应用到基于高阶高保真立体声(HOA)的信号。用于对HOA信号执行DRC的方法包括将该HOA信号变换到空间域,分析该变换的HOA信号,及从所述分析的结果获得可用于动态压缩的增益因子。该增益因子可以与HOA信号一起被发送。当应用DRC时,HOA信号被变换到空间域,该增益因子被提取并在空间域中与变换的HOA信号相乘,其中经增益补偿的变换的HOA信号被获得。该经增益补偿的变换的HOA信号被变换回HOA域,其中经增益补偿的HOA信号被获得。
-
公开(公告)号:CN108777836A
公开(公告)日:2018-11-09
申请号:CN201810453094.6
申请日:2014-10-20
申请人: 杜比国际公司
IPC分类号: H04S3/02
CPC分类号: H04S3/02 , H04S7/308 , H04S2400/11 , H04S2420/07 , H04S2420/11
摘要: 本公开涉及用于音频信号解码的解码矩阵的确定方法和装置。对于解码,需要特定于给定的扬声器设置并且使用已知的扬声器位置生成的解码矩阵。针对已知位置处的L个扬声器对声场格式的经编码的音频信号进行解码的改进方法包括以下步骤:将至少一个虚拟扬声器的位置添加(10)到L个扬声器的位置;生成(11)3D解码矩阵(D’),其中使用L个扬声器的位置(公式I)和至少一个虚拟位置(公式II);对3D解码矩阵(D’)进行向下混合(12);以及使用规模缩减的3D解码矩阵(公式III)对经编码的音频信号(i14)进行解码(14)。结果,获得多个经解码的扬声器信号(q14)。
-
公开(公告)号:CN108370487A
公开(公告)日:2018-08-03
申请号:CN201680070757.5
申请日:2016-11-29
申请人: 索尼公司
CPC分类号: H04S7/303 , H04R1/40 , H04R3/00 , H04R5/02 , H04R2201/401 , H04S3/008 , H04S7/00 , H04S2400/01 , H04S2400/11 , H04S2420/11
摘要: 本技术涉及能够更适当地再现声场的声音处理设备、方法以和程序。声源位置校正单元基于听到声音的听取位置来对指示每个对象声源的位置的声源位置信息进行校正,并且获得校正后声源位置信息。再现区域控制单元基于来自对象声源的声音的对象声源信号、听取位置以及校正后声源位置信息来计算空间频谱,以使得再现区域与球形或环形扬声器阵列内部的听取位置匹配。例如,本技术可以应用于声音处理设备。
-
公开(公告)号:CN104471640B
公开(公告)日:2018-06-05
申请号:CN201380038248.0
申请日:2013-07-19
申请人: 高通股份有限公司
IPC分类号: G10L19/008 , H04S7/00 , G10L19/22 , G10L19/24
CPC分类号: H04S1/007 , G10L19/008 , G10L19/22 , G10L19/24 , H04S3/008 , H04S7/30 , H04S2400/03 , H04S2400/11 , H04S2400/15 , H04S2420/03 , H04S2420/11
摘要: 一股来说,本发明描述用于将音频对象分组成群集的技术。在一些实例中,一种用于音频信号处理的装置包含群集分析模块,所述群集分析模块经配置以基于N个音频对象中的每一者的空间信息将包含所述N个音频对象的多个音频对象分组成L个群集,其中L小于N,其中所述群集分析模块经配置以接收来自传输信道、解码器及显现器中的至少一者的信息,且其中L的最大值是基于所述所接收信息。所述装置还包括:降混模块,其经配置以将所述多个音频对象混合成L个音频流;及元数据降混模块,其经配置以基于所述空间信息及所述分组产生指示所述L个音频流中的每一者的空间信息的元数据。
-
公开(公告)号:CN105027199B
公开(公告)日:2018-05-29
申请号:CN201480011198.1
申请日:2014-02-28
申请人: 高通股份有限公司
IPC分类号: G10L19/008 , G10L19/16
CPC分类号: G10L19/008 , G10L19/018 , G10L19/167 , G10L19/20 , H04S2420/11
摘要: 一般来说,本发明描述用于在位流中指定球谐系数的技术。一种包括一或多个处理器的装置可执行所述技术。所述处理器可经配置以从所述位流识别被包含于所述位流中且描述声场的多个阶层元素。所述处理器可进一步经配置以解析所述位流,从而确定所识别的所述多个阶层元素。
-
公开(公告)号:CN107945810A
公开(公告)日:2018-04-20
申请号:CN201610892254.8
申请日:2016-10-13
申请人: 杭州米谟科技有限公司
发明人: 向裴
IPC分类号: G10L19/008 , H04S3/00 , G10L19/038
CPC分类号: G10L19/008 , G10L19/038 , H04S3/00 , H04S3/008 , H04S2400/01 , H04S2420/11
摘要: 提供一种用于编码和解码HOA或多声道数据的方法和装置。原始高阶高保真度立体声像复制(HOA)信号需要由高码率流来表现。为了降低带宽,本发明公开了一种用于编码/解码和压缩/解压缩HOA的方法和装置,用于从频谱角度以及基于物理声音特性,将HOA编码和压缩为低码率流,或者从低码率流解码和解压缩。该方法和装置也适用于一般多声道数据压缩。编码信号大小上的降低压制了频谱或空间变换的额外工作负载。
-
公开(公告)号:CN107851432A
公开(公告)日:2018-03-27
申请号:CN201680043670.9
申请日:2016-07-27
申请人: 杜比实验室特许公司
CPC分类号: H04S3/02 , G10K15/12 , H04S2420/11
摘要: 用于根据输入声场信号创建输出声场信号的方法,所述方法包括以下步骤:(a)根据输入声场信号形成至少一个延迟信号;(b)对于每个延迟信号,通过声学变换处理来创建经声学变换的延迟信号;以及(c)将经声学变换的延迟信号与输入声场信号组合在一起以产生输出声场信号。
-
公开(公告)号:CN105284132B
公开(公告)日:2018-02-02
申请号:CN201480032630.5
申请日:2014-05-29
申请人: 高通股份有限公司
IPC分类号: H04S7/00
CPC分类号: H04S5/005 , G06F17/16 , G10L19/002 , G10L19/008 , G10L19/0204 , G10L19/038 , G10L19/06 , G10L19/167 , G10L19/20 , G10L25/18 , G10L2019/0001 , G10L2019/0005 , H04R2205/021 , H04S7/30 , H04S7/304 , H04S7/40 , H04S2400/01 , H04S2400/15 , H04S2420/01 , H04S2420/03 , H04S2420/11
摘要: 大体来说,本发明描述用于获得描述声场的相异分量的一或多个第一向量和描述所述声场的背景分量的一或多个第二向量的技术,所述一或多个第一向量和所述一或多个第二向量两者至少通过相对于多个球谐系数执行变换而产生。
-
-
-
-
-
-
-
-
-