用于对音频场景中声源的广度进行编码和解码的方法

    公开(公告)号:CN1973318A

    公开(公告)日:2007-05-30

    申请号:CN200380101325.9

    申请日:2003-10-10

    IPC分类号: G10L19/00

    CPC分类号: G10L19/00 H04S2420/03

    摘要: 公开了一种用于对音频信号的表示描述进行编码和解码的方法,以产生一种用于描述非点声源的参数描述,并使该参数描述与所述声源的音频信号链接。通过不同位置的多个去相关点声源来定义所述非点声源的表示。不同扩散算法被应用以确保各个输出的去相关。根据进一步实施例,定义了几种分布式不相关声源的基本形状,例如盒子、球和圆柱。也可以用相对于听众的孔径角来定义声源的宽度。此外,可以将基本形状组合起来以制作更复杂的形状。

    在多线程环境下的处理单元中处理数据的方法和设备

    公开(公告)号:CN1707435A

    公开(公告)日:2005-12-14

    申请号:CN200510075903.7

    申请日:2005-06-03

    IPC分类号: G06F9/46 H04N7/52

    CPC分类号: G06F9/4825

    摘要: 披露了一种用于在多线程环境下改进处理单元(14)的定时行为的方法,其中处理单元(14)通过合并来自多个输入单元(11、12和13)的数据来产生用于输出单元(16)的数据帧,并且将已处理的数据缓冲在处理单元和输出单元之间的输出缓冲器(15)中。该方法包括:将与输出缓冲器的填充相对应的值从输出单元发送到处理单元(18);计算定时器值;用定时器值来设置定时器(21),其中定时器在特定时间后调用处理单元线程。定时器值取决于与平均输出缓冲器的填充相对应的值。结果,该平均输出缓冲器(15)的填充与传统线程管理相比是较低的,因此系统更灵活、反应更快。

    在流系统中解码数据流的方法和设备

    公开(公告)号:CN100542281C

    公开(公告)日:2009-09-16

    申请号:CN200480019218.6

    申请日:2004-05-06

    IPC分类号: H04N7/24 H04N5/00

    摘要: 一种用于解码包括音频/视频子流(14)和控制子流的数据流的方法,包括:缓冲节点(12)可以在相同的缓冲器中缓冲多个数据分组。这通过具有针对已分配的缓冲器大小和任意存储分组的分离参数来实现。因此,不仅能够在缓冲节点(12)中存储多个分组,还可以在其缓冲器为空的同时存在这种节点,因此随后能够重复使用节点。这对于缓冲并选择性地访问MPEG-4音频节点或声音节点中的多个音频分组尤其有用。

    用于对音频信号的表示描述进行编码或解码的方法和设备

    公开(公告)号:CN1973318B

    公开(公告)日:2012-01-25

    申请号:CN200380101325.9

    申请日:2003-10-10

    IPC分类号: G10L19/00

    CPC分类号: G10L19/00 H04S2420/03

    摘要: 本发明公开了一种用于对音频信号的表示描述进行编码和解码的方法,以产生一种用于描述非点声源的参数描述,并使该参数描述与所述声源的音频信号链接。通过不同位置的多个去相关点声源来定义所述非点声源的表示。不同扩散算法被应用以确保各个输出的去相关。根据进一步实施例,定义了几种分布式不相关声源的基本形状,例如盒子、球和圆柱。也可以用相对于听众的孔径角来定义声源的宽度。此外,可以将基本形状组合起来以制作更复杂的形状。

    在多线程环境下的处理单元中处理数据的方法和设备

    公开(公告)号:CN1707435B

    公开(公告)日:2010-04-28

    申请号:CN200510075903.7

    申请日:2005-06-03

    IPC分类号: G06F9/46 H04N7/52

    CPC分类号: G06F9/4825

    摘要: 披露了一种用于在多线程环境下改进处理单元(14)的定时行为的方法,其中处理单元(14)通过合并来自多个输入单元(11、12和13)的数据来产生用于输出单元(16)的数据帧,并且将已处理的数据缓冲在处理单元和输出单元之间的输出缓冲器(15)中。该方法包括:将与输出缓冲器的填充相对应的值从输出单元发送到处理单元(18);计算定时器值;用定时器值来设置定时器(21),其中定时器在特定时间后调用处理单元线程。定时器值取决于与平均输出缓冲器的填充相对应的值。结果,该平均输出缓冲器(15)的填充与传统线程管理相比是较低的,因此系统更灵活、反应更快。

    用于描述音频信号的合成的方法

    公开(公告)号:CN1717955A

    公开(公告)日:2006-01-04

    申请号:CN200380104346.6

    申请日:2003-11-28

    IPC分类号: H04S3/00

    CPC分类号: H04S3/00 H04S2420/03

    摘要: 一种用于描述音频信号合成的方法,将所述音频信号编码为独立的音频对象。在声音场景中,通过在场景描述中层次排列的节点,描述音频对象的设置和处理。使用所述2D向量和描述所述音频对象深度的1D值,仅针对使用2D向量在2D屏幕上空间定位所指定的节点描述了音频对象的3D位置。在其它实施例中,进行了坐标映射,其使得在屏幕平面中图形对象的运动可以被映射到在垂直于所述屏幕平面的深度中的音频对象的运动。

    用于处理两个或更多个初始解码音频信号的方法和设备

    公开(公告)号:CN1711800A

    公开(公告)日:2005-12-21

    申请号:CN200380103090.7

    申请日:2003-11-24

    IPC分类号: H04S1/00 H04S3/00

    CPC分类号: H04S3/008 H04S1/007

    摘要: 在MPEG-4标准ISO/IEC 14496:2001中,能够以不同的MPEG-4格式编码类型进行编码的几个音频对象可以一起形成表示来自几个音频流的单一音轨的合成音频系统。在接收机中,分别解码多个音频对象,但并不直接回放给听众。代替地,使用所传输的混录指令,以准备单一的音轨。在要组合的音频信号具有不同的声道数或配置时,可能会发生混录冲突。根据本发明,使用额外的音频声道配置节点,将正确的声道配置信息项作为标签标记在要呈现的解码音频数据流上。本发明使内容提供商能够按照在所有情况下、接收机侧的呈现器均能产生正确的声道表示的方式来设置声道配置。声道配置数据中的转义码值有利于正确处理仍未定义的声道组合。

    用于描述音频信号的合成的方法

    公开(公告)号:CN1717955B

    公开(公告)日:2013-10-23

    申请号:CN200380104346.6

    申请日:2003-11-28

    IPC分类号: H04S3/00

    CPC分类号: H04S3/00 H04S2420/03

    摘要: 一种用于描述音频信号合成的方法,将所述音频信号编码为独立的音频对象。在声音场景中,通过在场景描述中层次排列的节点,描述音频对象的设置和处理。使用所述2D向量和描述所述音频对象深度的1D值,仅针对使用2D向量在2D屏幕上空间定位所指定的节点描述了音频对象的3D位置。在其它实施例中,进行了坐标映射,其使得在屏幕平面中图形对象的运动可以被映射到在垂直于所述屏幕平面的深度中的音频对象的运动。