-
公开(公告)号:CN107211062A
公开(公告)日:2017-09-26
申请号:CN201680008711.0
申请日:2016-02-03
Applicant: 杜比实验室特许公司
Abstract: 一种用于处理音频数据的方法,该方法包括:接收对应于多个音频实例的音频数据,音频数据包括以下中的至少一个:(a)被分别记录的来自多个端点的音频数据,或(b)来自对应于多个讲话者的单个端点的并且包括多个讲话者中的每一个的空间信息的音频数据;在虚拟声学空间中渲染音频数据,使得每个音频实例在虚拟声学空间中具有各自不同的虚拟位置;并且将音频实例调度为在至少两个音频实例之间具有重叠的情况下回放,其中至少部分地根据感知激发规则的集合来执行调度。
-
公开(公告)号:CN107211062B
公开(公告)日:2020-11-03
申请号:CN201680008711.0
申请日:2016-02-03
Applicant: 杜比实验室特许公司
Abstract: 一种用于处理音频数据的方法,该方法包括:接收对应于多个音频实例的音频数据,音频数据包括以下中的至少一个:(a)被分别记录的来自多个端点的音频数据,或(b)来自对应于多个讲话者的单个端点的并且包括多个讲话者中的每一个的空间信息的音频数据;在虚拟声学空间中渲染音频数据,使得每个音频实例在虚拟声学空间中具有各自不同的虚拟位置;并且将音频实例调度为在至少两个音频实例之间具有重叠的情况下回放,其中至少部分地根据感知激发规则的集合来执行调度。
-
公开(公告)号:CN107005677B
公开(公告)日:2020-08-04
申请号:CN201580062852.6
申请日:2015-11-18
Applicant: 杜比实验室特许公司
IPC: H04N7/14
Abstract: 本文公开的实施例涉及空间一致性调节。公开了一种用于调节视频会议中的空间一致性的方法。该方法包括将由视频端点设备采集的视觉场景展开为至少一个直线场景,该视频端点设备被配置成以全向方式采集视觉场景、检测至少一个直线场景与听觉场景之间的空间一致性,该听觉场景由相对于视频端点设备定位的音频端点设备所采集。该空间一致性为听觉场景与至少一个直线场景之间校准的程度并且响应于所检测的空间一致性低于阈值而调节空间一致性。还公开了相应的系统和计算机程序产品。
-
公开(公告)号:CN104205790B
公开(公告)日:2017-08-08
申请号:CN201380014466.0
申请日:2013-03-21
Applicant: 杜比实验室特许公司
IPC: H04M3/56
CPC classification number: H04M3/568 , H04S5/00 , H04S2400/11
Abstract: 本文档涉及设置并且管理用于音频会议的二维或三维场景。描述了会议控制器(111,175),该会议控制器(111,175)被配置为将与会议参加者相关联的上游音频信号(123,173)部署在将被呈现给收听者(211)的2D或3D会议场景内。在会议场景内设置具有X个不同空间讲话者位置(212)的X点会议场景,其中,X个讲话者位置(212)被定位在收听者的头部前面的围绕中线(215)的圆锥体内。该圆锥体的母线(216)和中线(215)形成小于或等于预定最大圆锥角的角度。将上游音频信号(123,173)分配到讲话者位置(212)之一,并且产生识别所分配的讲话者位置(212)的元数据,从而使得能够实现空间化音频信号。
-
公开(公告)号:CN107005677A
公开(公告)日:2017-08-01
申请号:CN201580062852.6
申请日:2015-11-18
Applicant: 杜比实验室特许公司
IPC: H04N7/14
Abstract: 本文公开的实施例涉及空间一致性调节。公开了一种用于调节视频会议中的空间一致性的方法。该方法包括将由视频端点设备采集的视觉场景展开为至少一个直线场景,该视频端点设备被配置成以全向方式采集视觉场景、检测至少一个直线场景与听觉场景之间的空间一致性,该听觉场景由相对于视频端点设备定位的音频端点设备所采集。该空间一致性为听觉场景与至少一个直线场景之间校准的程度并且响应于所检测的空间一致性低于阈值而调节空间一致性。还公开了相应的系统和计算机程序产品。
-
公开(公告)号:CN116547748A
公开(公告)日:2023-08-04
申请号:CN202180081475.6
申请日:2021-12-01
Applicant: 杜比实验室特许公司
IPC: G10L19/008
Abstract: 公开了用于多通道编解码器中的空间噪声填充的实施例。在一个实施例中,一种通过生成空间空洞填充噪声在多通道编解码器中重新生成背景噪声环境的方法,包括:基于从表示具有背景噪声环境的空间音频场景的输入音频信号生成的主下混通道计算噪声估计;基于该噪声估计计算频谱整形滤波器系数;使用频谱整形滤波器系数和噪声分布对多通道噪声信号进行频谱整形,频谱整形得到具有不相关通道的扩散的多通道噪声信号;基于空间音频场景的噪声环境,对具有不相关通道的扩散的、不相关的多通道噪声信号进行空间整形;并且将空间和频谱整形的多通道噪声添加到多通道编解码器输出,以合成空间音频场景的背景噪声环境。
-
公开(公告)号:CN116171474A
公开(公告)日:2023-05-26
申请号:CN202180061795.5
申请日:2021-09-07
IPC: G10L19/16
Abstract: 一种方法包括接收用于第一参数编码的输入音频信号的第一输入位流,该第一输入位流包括表示第一输入核心音频信号和包括与第一参数编码的输入音频信号相关的至少一个空间参数的第一集合的数据。第一参数编码的音频信号的第一协方差矩阵是基于第一集合的(一个或多个)空间参数来确定的。基于所确定的第一协方差矩阵来确定包括至少一个空间参数的修改集合,其中修改集合与第一集合不同。确定基于第一输入核心音频信号或由第一输入核心音频信号构成的输出核心音频信号。生成用于参数编码的输出音频信号的输出位流,该输出位流包括表示输出核心音频信号和修改集合的数据。
-
公开(公告)号:CN104205790A
公开(公告)日:2014-12-10
申请号:CN201380014466.0
申请日:2013-03-21
Applicant: 杜比实验室特许公司
IPC: H04M3/56
CPC classification number: H04M3/568 , H04S5/00 , H04S2400/11
Abstract: 本文档涉及设置并且管理用于音频会议的二维或三维场景。描述了会议控制器(111,175),该会议控制器(111,175)被配置为将与会议参加者相关联的上游音频信号(123,173)部署在将被呈现给收听者(211)的2D或3D会议场景内。在会议场景内设置具有X个不同空间讲话者位置(212)的X点会议场景,其中,X个讲话者位置(212)被定位在收听者的头部前面的围绕中线(215)的圆锥体内。该圆锥体的母线(216)和中线(215)形成小于或等于预定最大圆锥角的角度。将上游音频信号(123,173)分配到讲话者位置(212)之一,并且产生识别所分配的讲话者位置(212)的元数据,从而使得能够实现空间化音频信号。
-
-
-
-
-
-
-