-
公开(公告)号:CN105992120B
公开(公告)日:2019-12-31
申请号:CN201510066647.9
申请日:2015-02-09
申请人: 杜比实验室特许公司
IPC分类号: H04S7/00
摘要: 本发明的实施例涉及音频信号的上混音。描述了一种对音频信号进行上混音的方法。该方法包括:将所述音频信号分解成扩散信号和直达信号;至少部分地基于扩散信号,生成音频静态环境声,音频静态环境声包括高度声道;从直达信号中提取音频对象;估计音频对象的元数据,元数据包括音频对象的高度信息;以及将音频静态环境声和音频对象呈现为经过上混音的音频信号,其中音频静态环境声被呈现到预定义的位置并且音频对象根据元数据而被呈现。还公开了相应的系统和计算机程序产品。
-
-
公开(公告)号:CN106297820A
公开(公告)日:2017-01-04
申请号:CN201510247108.5
申请日:2015-05-14
申请人: 杜比实验室特许公司
IPC分类号: G10L21/0272
CPC分类号: G10L21/0308 , G10L19/008 , G10L21/0264 , G10L21/0272 , G10L25/18
摘要: 本文中公开的示例实施例涉及利用基于迭代加权的成分分析确定的源方向的音频源分离。公开了一种分离音频内容中的音频源的方法。该音频内容包括多个声道。该方法包括从音频内容的多个时频块中获得多个数据样本。该方法还包括在多次迭代中分析数据样本以生成多个成分,其中这些成分中的每个成分指示具有数据样本的方差的方向,并且其中在多次迭代的每次迭代中,利用权值来加权数据样本中的每个数据样本,权值基于多个成分中所选择的成分。该方法进一步包括基于所选择的成分来确定音频内容的源方向,以供从音频内容中分离音频源。还公开了相应的分离音频内容中的音频源的系统和计算机程序产品。
-
公开(公告)号:CN105657633A
公开(公告)日:2016-06-08
申请号:CN201410459713.4
申请日:2014-09-04
申请人: 杜比实验室特许公司
IPC分类号: H04S3/00
CPC分类号: H04S7/302 , G01S5/18 , G10L19/008 , G11B27/10 , H04S7/30 , H04S7/301 , H04S2400/01 , H04S2400/11 , H04S2420/01
摘要: 本发明的实施例涉及音频对象处理。公开了一种用于处理音频内容的方法,该音频内容包括至少一个多声道格式的音频对象。该方法包括生成与音频对象相关联的元数据,该元数据包括音频对象的估计轨迹和音频对象的估计感知大小中的至少一个,该感知大小是由至少两个换能器产生的音频对象的幻象的所感知到的区域。还公开了相应的系统和计算机程序产品。
-
公开(公告)号:CN105355214A
公开(公告)日:2016-02-24
申请号:CN201510836761.5
申请日:2011-08-19
申请人: 杜比实验室特许公司
IPC分类号: G10L25/51
CPC分类号: G10L25/51 , G10L19/038 , H04R29/00
摘要: 描述了测量相似度的方法和设备。一种测量两个音频分段之间的内容相似度的方法,包括:从所述音频分段中提取第一特征向量,其中所述第一特征向量中的每一个中的所有特征值都是非负的并被归一化,使得所述特征值的和为1;根据所述特征向量,基于狄里克雷分布生成用于计算所述内容相似度的统计模型;以及基于所生成的统计模型计算所述内容相似度。
-
公开(公告)号:CN104885151A
公开(公告)日:2015-09-02
申请号:CN201380066933.4
申请日:2013-11-25
申请人: 杜比实验室特许公司
IPC分类号: G10L19/008 , H04S7/00 , G10L19/20
CPC分类号: G10L19/008 , G10L19/02 , G10L19/20 , G10L25/18 , H04S7/30 , H04S2400/13 , H04S2420/03
摘要: 实施例针对呈现基于对象的音频的方法,该方法包括:确定具有对象音频数据和相关的元数据的对象的初始空间位置;确定对象的感知重要性;和基于确定的对象的感知重要性将音频对象分组为数个群集,使得通过将对象从初始空间位置移动到群集中的第二空间位置导致的空间误差对于具有相对高的感知重要性的对象被最小化。感知重要性至少部分地基于对象的部分响度和对象的内容语义。
-
公开(公告)号:CN104683933A
公开(公告)日:2015-06-03
申请号:CN201310629972.2
申请日:2013-11-29
申请人: 杜比实验室特许公司
IPC分类号: H04S3/00
CPC分类号: G10L19/02 , G10L19/008 , G10L19/038 , H04S3/008 , H04S2400/11
摘要: 本发明的实施例涉及音频对象提取。公开了一种用于从音频内容中提取音频对象的方法,所述音频内容具有基于多个声道的格式,所述方法包括:至少部分地基于所述多个声道之间的频谱相似性,对所述音频内容的各帧应用音频对象提取;以及基于对所述各帧的所述音频对象提取,跨所述音频内容的帧执行音频对象合成,以生成至少一个音频对象的音轨。还公开了相应的系统和计算机程序产品。
-
公开(公告)号:CN104080024A
公开(公告)日:2014-10-01
申请号:CN201310100422.1
申请日:2013-03-26
申请人: 杜比实验室特许公司
CPC分类号: H03G7/002 , G10L21/0364 , G10L25/30 , G10L25/51 , H03G3/3089 , H03G3/32 , H03G5/165 , H03G7/007 , H04M7/006 , H04M2203/305
摘要: 公开了音量校平器控制器和控制方法。在一个实施方式中,音量校平器控制器包括:音频内容分类器,用于实时地识别音频信号的内容类型;以及调整单元,用于基于所识别的内容类型来以连续的方式调整音量校平器。调整单元被配置成使音量校平器的动态增益与该音频信号的信息性内容类型正相关,并且使音量校平器的动态增益与该音频信号的干扰性内容类型负相关。
-
-
公开(公告)号:CN116965062A
公开(公告)日:2023-10-27
申请号:CN202280015933.0
申请日:2022-02-15
申请人: 杜比实验室特许公司
IPC分类号: H04S7/00
摘要: 一种用于对音频对象进行聚类的方法可以涉及识别多个音频对象,其中,该多个音频对象中的每个音频对象与指示相应空间位置信息的相应元数据和相应渲染元数据相关联。该方法可以涉及将该多个音频对象中的音频对象指派到多个渲染元数据类别中的渲染元数据类别,其中,至少一个渲染元数据类别包括要保持的多个渲染元数据类型。该方法可以涉及确定多个音频对象簇到每个渲染元数据类别的分配。该方法可以涉及基于指示空间位置信息的元数据并且基于音频对象到渲染元数据类别的指派,将该多个音频对象中的音频对象渲染到经分配的多个音频对象簇。
-
-
-
-
-
-
-
-
-