从音频内容基于投影提取音频对象

    公开(公告)号:CN105898667A

    公开(公告)日:2016-08-24

    申请号:CN201410814973.9

    申请日:2014-12-22

    IPC分类号: H04S5/00 H04S5/02

    摘要: 本发明的实施方式涉及音频对象提取。公开了一种用于从音频内容中提取音频对象的方法。该方法包括标识第一投影空间集合,所述第一投影空间集合包括用于所述多个声道中的第一声道的第一子集和用于所述多个声道中的第二声道的第二子集。该方法可以进一步包括确定所述第一声道和所述第二声道之间的第一相关性集合,所述第一相关性集合中的每个相关性对应于所述第一投影空间子集中的一个投影空间和所述第二投影空间子集中的一个投影空间。另外,该方法可以包括至少部分地基于所述第一相关性集合中的第一相关性和来自所述第一子集的对应于所述第一相关性的投影空间来从所述第一声道的音频信号中提取音频对象,所述第一相关性大于第一预定义阈值。也公开了对应的系统和计算机程序产品。

    使用多重解相关方法的卷积盲源分隔

    公开(公告)号:CN1307747A

    公开(公告)日:2001-08-08

    申请号:CN99807114.5

    申请日:1999-04-08

    IPC分类号: H03H21/00

    摘要: 使用卷积信号解相关技术执行盲源分隔的方法与装置。本发明累加一段输入信号(混合的信号),这一输入信号包括一系列来自独立信号源的独立的信号。然后,本发明把这段输入信号划分成一系列T-长度周期(窗口),并在每一T-长度周期中的信号上执行一个离散的傅里叶变换(DFT),然后使用一系列平均的DFT值计算估计的互相关的值。计算总数为K个的互相关的值,其中K个值中的每一个在N个T-长度周期上是平均的。一个梯度下降处理使用互相关的值计算一个FIR过滤器的系数,这一处理将有效分隔输入信号中的源信号。为了实现一个精确的方案,对梯度下降处理加以限制,其中,过滤器系数的时间域值仅可达到某些值,即把时间域过滤器系数值W(τ)限制在每一T-长度周期中,以使其对于任何时间t>Q时为0。在这一方式中,计算出针对FIR过滤器系数的一个唯一的方案,使用这些系数所产生的一个过滤器将有效分隔源信号。

    对延迟和滤波的信源进行盲目分离的方法和设备

    公开(公告)号:CN1154016A

    公开(公告)日:1997-07-09

    申请号:CN96120890.2

    申请日:1996-12-11

    发明人: 卡里·托卡拉

    IPC分类号: H04B1/00

    摘要: 一种从同等数量的包括源信号分量的混合信号中恢复源信号。信道1和2混合信号被乘以信道1和2自适应加权分别地产生信道1和2乘积信号。信道1的滤波反馈信号从信道2近似信号中产生,信道2的滤波反馈信号从信道1近似信号中产生。信道1的滤波反馈信号被加到信道1乘积信号上产生信道1近似信号,而信道2的滤波反馈信号被加到信道2乘积信号上产生信道2近似信号。非线性函数加到近似信号产生输出信号。自适应加权和滤波反馈信号被调节使输出信号的熵最大。

    使用多重解相关方法的卷积盲源分隔

    公开(公告)号:CN100514856C

    公开(公告)日:2009-07-15

    申请号:CN99807114.5

    申请日:1999-04-08

    IPC分类号: H03H21/00

    摘要: 使用卷积信号解相关技术执行盲源分隔的方法与装置。本发明累加一段输入信号(混合的信号),这一输入信号包括一系列来自独立信号源的独立的信号。然后,本发明把这段输入信号划分成一系列T-长度周期(窗口),并在每一T-长度周期中的信号上执行一个离散的傅里叶变换(DFT),然后使用一系列平均的DFT值计算估计的互相关的值。计算总数为K个的互相关的值,其中K个值中的每一个在N个T-长度周期上是平均的。一个梯度下降处理使用互相关的值计算一个FIR过滤器的系数,这一处理将有效分隔输入信号中的源信号。为了实现一个精确的方案,对梯度下降处理加以限制,其中,过滤器系数的时间域值仅可达到某些值,即把时间域过滤器系数值W(τ)限制在每一T-长度周期中,以使其对于任何时间t>Q时为0。在这一方式中,计算出针对FIR过滤器系数的一个唯一的方案,使用这些系数所产生的一个过滤器将有效分隔源信号。

    对延迟和滤波的信源进行盲目分离的方法

    公开(公告)号:CN1097346C

    公开(公告)日:2002-12-25

    申请号:CN96120890.2

    申请日:1996-12-11

    发明人: 卡里·托卡拉

    IPC分类号: H04B1/00

    摘要: 一种从同等数量的包括源信号分量的混合信号中恢复源信号。信道1和2混合信号被乘以信道1和2自适应加权分别地产生信道1和2乘积信号。信道1的滤波反馈信号从信道2近似信号中产生,信道2的滤波反馈信号从信道1近似信号中产生。信道1的滤波反馈信号被加到信道1乘积信号上产生信道1近似信号,而信道2的滤波反馈信号被加到信通2乘积信号上产生信道2近似信号。非线性函数加到近似信号产生输出信号。自适应加权和滤波反馈信号被调节使输出信号的熵最大。

    混响环境的源分离
    6.
    发明公开

    公开(公告)号:CN109644304A

    公开(公告)日:2019-04-16

    申请号:CN201780052977.X

    申请日:2017-08-28

    发明人: 王珺

    摘要: 本发明揭示混响环境的源分离的实施例。根据方法,分别通过至少两个麦克风针对其间仅至少一个源中的个别者产生声音的时段捕获针对每一所述个别者的第一麦克风信号。通过处理器基于所述第一麦克风信号学习用于对所述至少一个源与所述至少两个麦克风之间的声路建模的混合参数。分别通过所述至少两个麦克风针对其间所述至少一个源中的全部产生声音的时段捕获第二麦克风信号。通过所述处理器基于所述混合参数及第二麦克风信号估计所述重建模型。所述处理器通过应用所述重建模型而执行所述源分离。