-
-
公开(公告)号:CN104885151B
公开(公告)日:2017-12-22
申请号:CN201380066933.4
申请日:2013-11-25
申请人: 杜比实验室特许公司
IPC分类号: G10L19/008 , H04S7/00 , G10L19/20
CPC分类号: G10L19/008 , G10L19/02 , G10L19/20 , G10L25/18 , H04S7/30 , H04S2400/13 , H04S2420/03
摘要: 实施例针对呈现基于对象的音频的方法,该方法包括:确定具有对象音频数据和相关的元数据的对象的初始空间位置;确定对象的感知重要性;和基于确定的对象的感知重要性将音频对象分组为数个群集,使得通过将对象从初始空间位置移动到群集中的第二空间位置导致的空间误差对于具有相对高的感知重要性的对象被最小化。感知重要性至少部分地基于对象的部分响度和对象的内容语义。
-
-
公开(公告)号:CN106663210A
公开(公告)日:2017-05-10
申请号:CN201580035750.5
申请日:2015-06-24
申请人: 杜比实验室特许公司
CPC分类号: G10L25/54 , G06K9/6259 , G06K9/6261 , G10L25/03
摘要: 本文公开的示例实施例涉及基于感受的多媒体处理。公开了一种用于处理多媒体数据的方法,所述方法包括:基于多个类而自动地确定关于所述多媒体数据的片段的用户感受,所述多个类与预定义用户感受相关联地被获取;以及至少部分地基于所确定的关于所述片段的所述用户感受,处理所述多媒体数据的所述片段。还公开了相应的系统和计算机程序产品。
-
公开(公告)号:CN105895086A
公开(公告)日:2016-08-24
申请号:CN201410765578.6
申请日:2014-12-11
申请人: 杜比实验室特许公司
摘要: 本发明的实施例涉及音频对象聚类。公开了一种用于元数据保留的音频对象聚类的方法。该方法包括基于与多个音频对象相关联的元数据中的待保留信息,将多个音频对象分类到多个类别中。该方法还包括将预定数目的簇指派给类别,以及根据指派来将这些类别中的每个类别中的音频对象分配到簇中的至少一个簇。还公开了相应的系统和计算机程序产品。
-
公开(公告)号:CN105335595A
公开(公告)日:2016-02-17
申请号:CN201410320668.4
申请日:2014-06-30
申请人: 杜比实验室特许公司
IPC分类号: G06F19/00
CPC分类号: G10L25/54 , G06K9/6259 , G06K9/6261 , G10L25/03
摘要: 本发明的实施例涉及基于感受的多媒体处理。公开了一种用于处理多媒体数据的方法,所述方法包括:基于多个类而自动地确定关于所述多媒体数据的片段的用户感受,所述多个类与预定义用户感受相关联地被获取;以及至少部分地基于所确定的关于所述片段的所述用户感受,处理所述多媒体数据的所述片段。还公开了相应的系统和计算机程序产品。
-
公开(公告)号:CN104240711A
公开(公告)日:2014-12-24
申请号:CN201310246711.2
申请日:2013-06-18
申请人: 杜比实验室特许公司
IPC分类号: G10L19/008 , G10L21/038
摘要: 本发明的实施例涉及自适应音频内容生成。具体而言,公开了一种用于生成自适应音频内容的方法,该方法包括:从基于声道的源音频内容中提取至少一个音频对象,以及至少部分地基于该至少一个音频对象生成自适应音频内容。还公开了相应的系统和计算机程序产品。
-
公开(公告)号:CN102982804A
公开(公告)日:2013-03-20
申请号:CN201110269279.X
申请日:2011-09-02
申请人: 杜比实验室特许公司
摘要: 描述了用于音频分类的实施例。音频分类系统包含对音频信号执行音频分类的过程的至少一个装置。该至少一个装置能够在需要不同资源的至少两个模式下工作。音频分类系统也包含复杂度控制器,其确定组合并且指示该至少一个装置根据该组合来工作。对于该至少一个装置中的每个,该组合指定该装置的模式之一,而该组合的资源要求不超过最大可用资源。通过控制模式,音频分类系统改善了针对运行环境的可伸缩性。
-
公开(公告)号:CN118871988A
公开(公告)日:2024-10-29
申请号:CN202380026864.8
申请日:2023-02-06
申请人: 杜比实验室特许公司
IPC分类号: G10L21/034 , H03G7/00 , G10L21/0216 , G06F3/16 , G10L25/51 , G10L25/84 , G10L25/81
摘要: 使用音量调节控制信号对音频信号进行音量调节。该方法包括:确定噪声可靠性比率w(n)作为当前时间段中似噪声帧与所有帧的比率;确定PGC噪声置信度分数XPGN(n),该分数指示在该时间段内存在专业生成内容PGC噪声的可能性;以及对于该时间段,确定噪声可靠性比率是否高于预定阈值。当噪声可靠性比率高于预定阈值时,基于PGC噪声置信度分数更新音量调节控制信号,当噪声可靠性比率低于预定阈值时,音量调节控制信号保持不变。通过防止增强例如UGC中的手机录制的环境噪声,同时对于其他类型内容保持原始行为,来改善音量调节。
-
公开(公告)号:CN117859176A
公开(公告)日:2024-04-09
申请号:CN202280057779.3
申请日:2022-08-23
申请人: 杜比实验室特许公司
IPC分类号: G10L21/0216 , G10L21/0264
摘要: 一种音频处理方法包括使用第一模型将音频信号分类为噪声或非噪声。对于噪声信号,使用第二模型将音频信号分类为用户生成内容(UGC)噪声或专业生成内容(PGC)噪声。对于非噪声信号或PGC噪声,使用第一音频处理过程来处理音频信号。对于UGC噪声,使用第二音频处理过程来处理音频信号。
-
-
-
-
-
-
-
-
-