经由多对处理进行多声道和多流源分离

    公开(公告)号:CN118974824A

    公开(公告)日:2024-11-15

    申请号:CN202380032121.1

    申请日:2023-03-17

    摘要: 一种用于从包括N个音频信号的多声道音频输入中分离目标音频源的方法和系统,N>=3。将N个音频信号组合成至少两个独特信号对,并且对每个信号对执行成对源分离,以生成至少两个经处理的信号对,每个经处理的信号对包括信号对中的音频信号的源分离版本。将至少两个经处理的信号对进行组合,以形成具有与N个音频信号相对应的N个目标音频信号的目标音频源。

    空间可识别子带音频源的检测和提取方法、装置以及系统

    公开(公告)号:CN115715413A

    公开(公告)日:2023-02-24

    申请号:CN202180041824.1

    申请日:2021-06-11

    IPC分类号: G10L21/0272

    摘要: 在实施例中,一种方法包括:将双声道时域音频信号的一个或多个帧变换成包括多个时频片的时频域表示,其中时频域表示的频域包括多个频率仓,该多个频率仓被分组成子带。针对每个时频片,该方法包括:计算时频片的空间参数和电平;使用移位参数和挤压参数修改空间参数;使用经修改的空间参数、电平、以及子带信息获得用于每个频率仓的软掩码值;以及将软掩码值应用于时频片以生成所估计的音频源的经修改的时频片。在实施例中,时频片的多个帧被组装成多个组块,其中,每个组块包括多个子带,并且上述方法针对每个组块中的每个子带执行。

    使用最少的训练分离一般化立体声背景与平移源

    公开(公告)号:CN115699171A

    公开(公告)日:2023-02-03

    申请号:CN202180041971.9

    申请日:2021-06-11

    发明人: A·S·马斯特

    IPC分类号: G10L21/0272

    摘要: 在实施例中,通过以下方式创建空间电平滤波器(SLF):从频域中的子频带中的多个目标源电平分布和空间分布获得第一样本集;从频域中的子频带中的多个背景电平分布和空间分布获得第二样本集;将第一样本集和第二样本集相加以创建组合样本集;针对每个子带,检测组合样本集中的每个样本的电平参数和空间参数;在子带内,通过目标源和背景的相应电平分布和空间分布对检测到的电平参数和空间参数进行加权;将组合样本集中的每个样本在子带内的加权后的电平参数、空间参数和信噪比(SNR)存储在表中;以及通过子带以及加权后的电平参数和空间参数对该表重新索引。

    组合空间提示和源提示的源分离

    公开(公告)号:CN118974825A

    公开(公告)日:2024-11-15

    申请号:CN202380031124.3

    申请日:2023-03-17

    IPC分类号: G10L21/028 G10L19/008

    摘要: 本公开涉及一种用于源分离的音频处理方法和系统。所述方法包括获得包括至少两个通道的输入音频信号(A),以及利用基于空间提示的分离模块(10)处理所述输入音频信号(A)以获得中间音频信号(B)。所述基于空间提示的分离模块(10)被配置为确定所述输入音频信号(A)的至少两个通道的混合参数并基于所述混合参数修改所述通道以获得所述中间音频信号(B)。所述方法进一步包括利用基于源提示的分离模块(20)处理所述中间音频信号(B)以生成输出音频信号(C),其中,所述基于源提示的分离模块(20)被配置为实施神经网络,所述神经网络被训练用于在给定所述中间音频信号(B)的情况下预测降噪输出音频信号(C)。

    用于控制对经低比特率编码的音频的增强的方法和装置

    公开(公告)号:CN112639968B

    公开(公告)日:2024-10-01

    申请号:CN201980055735.5

    申请日:2019-08-29

    IPC分类号: G10L19/24 G10L21/02 G10L25/30

    摘要: 描述了一种用于对音频数据进行低比特率编码并生成用于在解码器侧控制对所述经低比特率编码的音频数据的音频增强的增强元数据的方法,所述方法包括以下步骤:(a)以低比特率对原始音频数据进行核心编码以获得经编码的音频数据;(b)生成要用于在对所述经编码的音频数据进行核心解码之后在所述解码器侧控制音频增强的类型和/或量的增强元数据;以及(c)输出所述经编码的音频数据和所述增强元数据。进一步描述了被配置为执行所述方法的编码器。此外,描述了一种用于基于增强元数据从经低比特率编码的音频数据生成增强的音频数据的方法以及一种被配置为执行所述方法的解码器。

    用于控制对经低比特率编码的音频的增强的方法和装置

    公开(公告)号:CN112639968A

    公开(公告)日:2021-04-09

    申请号:CN201980055735.5

    申请日:2019-08-29

    IPC分类号: G10L19/24 G10L21/02 G10L25/30

    摘要: 描述了一种用于对音频数据进行低比特率编码并生成用于在解码器侧控制对所述经低比特率编码的音频数据的音频增强的增强元数据的方法,所述方法包括以下步骤:(a)以低比特率对原始音频数据进行核心编码以获得经编码的音频数据;(b)生成要用于在对所述经编码的音频数据进行核心解码之后在所述解码器侧控制音频增强的类型和/或量的增强元数据;以及(c)输出所述经编码的音频数据和所述增强元数据。进一步描述了被配置为执行所述方法的编码器。此外,描述了一种用于基于增强元数据从经低比特率编码的音频数据生成增强的音频数据的方法以及一种被配置为执行所述方法的解码器。