解码音频信号的方法和装置

    公开(公告)号:CN102349108B

    公开(公告)日:2014-08-20

    申请号:CN201080011640.2

    申请日:2010-01-28

    Inventor: 吴贤午 郑亮源

    CPC classification number: G10L19/20 G10L19/008 G10L19/167 H04S2420/03

    Abstract: 本发明涉及用于处理音频信号的装置及方法。本发明包括:接收包括多个对象的下混合信号以及包括对象信息和下混合增益信息的比特流;获取用于指示在比特流中是否存在电平指导信息的用于所有帧的电平指导标记信息;基于电平指导标记信息,从比特流获取电平指导信息,电平指导信息表示应用于多个对象中至少一个对象的对象电平的限制;接收混合信息;基于电平指导信息和下混合增益信息,通过修改混合信息来产生修改后的混合信息;并且基于修改后的混合信息和所述对象信息,产生下混合处理信息和多声道信息中的至少一个,其中使用用于多个对象中至少一个对象的对象电平,估计混合信息,并且当产生下混合信号时,确定对象信息和下混合增益信息。因此,本发明可以用对定位和/或增益调整提供限制范围的方式,防止根据定位和/或增益调整的声音质量的失真。

    用于处理音频信号的方法和装置

    公开(公告)号:CN101636919B

    公开(公告)日:2013-10-30

    申请号:CN200880008659.4

    申请日:2008-03-17

    Inventor: 吴贤午 郑亮源

    CPC classification number: G10L19/008

    Abstract: 本发明公开了一种用于处理音频信号的方法和装置。所述方法包括接收向下混频信息,该向下混频信息具有向下混频的至少两个独立对象和背景对象;使用第一增强对象信息将所述向下混频信息分离成第一独立对象和临时背景对象:以及使用第二增强对象信息从临时背景对象中提取第二独立对象。

    用于对话增强技术的控制器和用户界面

    公开(公告)号:CN101518098B

    公开(公告)日:2013-10-23

    申请号:CN200780034319.4

    申请日:2007-09-14

    Inventor: 吴贤午 郑亮源

    Abstract: 处理多声道音频信号(例如,立体声音频)以相对于其它信号(例如,反射声音或混响声音)修改估计对话信号(例如,由电影中的演员说出的对话)的增益(例如,音量级或响度)。在某些方面,控制器用于控制主音量和对话音量。在某些方面,一个或多个图形对象和/或用户界面元件用于指示音量级别和其它信息。

    对话增强技术
    57.
    发明授权

    公开(公告)号:CN101518102B

    公开(公告)日:2013-06-19

    申请号:CN200780034380.9

    申请日:2007-09-14

    Inventor: 吴贤午 郑亮源

    Abstract: 处理多声道音频信号(例如,立体声音频)以相对于其它信号(例如,反射的或混响声音)修改估计对话信号(例如,由电影中的演员说出的对话)的增益(例如,音量级或响度)。在某些方面,将分类器用于分类多声道音频信号或估计对话信号中的分量信号。在某些方面,相对于该多声道音频信号或其它分量信号维持对话信号的所需音量级。

    信号处理的方法和装置以及编码和解码方法及其装置

    公开(公告)号:CN101283406B

    公开(公告)日:2013-06-19

    申请号:CN200680037381.4

    申请日:2006-10-04

    Abstract: 公开了用于处理信号的装置及其方法。互相结合地执行数据译码和熵译码,且通过编组提高译码效率。本发明包括以下步骤:获取与导引基准值相对应的数据的数目,并且如果数据频带的数目满足预定条件,则获取导引基准值和与该导引基准值相对应的导引差分值,并利用导引基准值和导引差分值获取数据。数据的数目是利用其中包括该数据的数据频带的数目来获取的。本发明包括以下步骤:利用数据的数目来确定多个数据译码方案中的一个,并根据所确定的数据译码方案来解码数据,其中多个数据译码方案至少包括导引译码方案。

    用于编码/解码信号的装置和方法

    公开(公告)号:CN101379555B

    公开(公告)日:2013-03-13

    申请号:CN200780004555.1

    申请日:2007-02-07

    Abstract: 本发明提供了一种编码方法和装置以及一种解码方法和装置。该解码方法包括:从输入比特流提取针对第一多声道解码器优化的兼容缩减混音信号;通过对兼容缩减混音信号执行兼容性处理操作将兼容缩减混音信号转换成针对第二多声道信号优化;并通过对转换的缩减混音信号执行3D渲染操作来生成三维(3D)缩减混音信号。因此,高效率地编码具有3D效果的多声道信号,并根据音频再现环境的特性以最优音质自适应地恢复和再现音频信号是可能的。

    解码音频信号的方法和装置

    公开(公告)号:CN101356572B

    公开(公告)日:2013-02-13

    申请号:CN200680042071.1

    申请日:2006-09-14

    Abstract: 揭示了一种解码音频信号的装置及其方法。本发明包括接收音频信号和空间信息,识别经修改空间信息的类型,使用空间信息生成经修改空间信息,及使用经修改空间信息解码音频信号,其中经修改空间信息的类型至少包括部分空间信息、组合空间信息、以及扩展空间信息中的至少一种。因此,音频信号可以解码成与编码装置所决定的配置不同的配置。即使扬声器数少于或者多于在执行声道缩减混音之前的多声道的数目,也能够从声道缩减混音音频信号生成与扬声器数相等数目的输出声道。

Patent Agency Ranking