信号处理中的源分离和再混合
    1.
    发明公开

    公开(公告)号:CN118266022A

    公开(公告)日:2024-06-28

    申请号:CN202280076263.3

    申请日:2022-10-26

    摘要: 本公开涉及一种用于执行源分离的方法和音频处理系统(1)。方法包括:获得(S1)包括语音内容和噪声内容的混合的音频信号(Sin);从音频信号中确定(S2a,S2b,S2c)语音内容(式A)、平稳噪声内容(式C)和非语音内容(式B)。平稳噪声内容(式C)是非语音内容(式B)的真子集,并且方法进一步包括:基于平稳噪声内容(式C)与非语音内容(式B)之间的差异来确定(S3)非平稳噪声内容(式D);获得(S5)加权因子集合;以及基于用相应的加权因子加权的语音内容(式A)、平稳噪声内容(式C)和非平稳噪声内容(式D)的组合来形成(S6)经处理的音频信号。#imgabs0##imgabs1##imgabs2##imgabs3#

    响应于多通道音频通过使用至少一个反馈延迟网络产生双耳音频

    公开(公告)号:CN107835483B

    公开(公告)日:2020-07-28

    申请号:CN201711094063.8

    申请日:2014-12-18

    IPC分类号: G10L19/008

    摘要: 本公开涉及响应于多通道音频通过使用至少一个反馈延迟网络产生双耳音频。在一些实施例中,提供用于响应多通道音频信号的通道产生双耳信号的虚拟化方法,这些虚拟化方法向各通道应用双耳房间脉冲响应(BRIR),包含通过使用至少一个反馈延迟网络(FDN)以向通道的下混应用公共晚期混响。在一些实施例中,输入信号通道在第一处理路径中被处理,以向各通道应用的用于该通道的单通道BRIR的直接响应和早期反射部分,并且,通道的下混在包含至少一个应用公共晚期混响的FDN的第二处理路径中被处理。典型地,公共晚期混响模仿单通道BRIR中的至少一些的晚期混响部分的共同宏观属性。其它方面是被配置为执行方法的任何实施例的耳机虚拟化器。

    响应于多通道音频通过使用至少一个反馈延迟网络产生双耳音频

    公开(公告)号:CN111065041A

    公开(公告)日:2020-04-24

    申请号:CN201911321337.1

    申请日:2014-12-18

    IPC分类号: H04S7/00 G10L19/008 H04S3/00

    摘要: 本公开涉及响应于多通道音频通过使用至少一个反馈延迟网络产生双耳音频。在一些实施例中,提供用于响应多通道音频信号的通道产生双耳信号的虚拟化方法,这些虚拟化方法向各通道应用双耳房间脉冲响应(BRIR),包含通过使用至少一个反馈延迟网络(FDN)以向通道的下混应用公共晚期混响。在一些实施例中,输入信号通道在第一处理路径中被处理,以向各通道应用的用于该通道的单通道BRIR的直接响应和早期反射部分,并且,通道的下混在包含至少一个应用公共晚期混响的FDN的第二处理路径中被处理。典型地,公共晚期混响模仿单通道BRIR中的至少一些的晚期混响部分的共同宏观属性。其它方面是被配置为执行方法的任何实施例的耳机虚拟化器。

    响应于多通道音频通过使用至少一个反馈延迟网络产生双耳音频

    公开(公告)号:CN107750042B

    公开(公告)日:2019-12-13

    申请号:CN201711094042.6

    申请日:2014-12-18

    IPC分类号: H04S3/00

    摘要: 本公开涉及响应于多通道音频通过使用至少一个反馈延迟网络产生双耳音频。在一些实施例中,提供用于响应多通道音频信号的通道产生双耳信号的虚拟化方法,这些虚拟化方法向各通道应用双耳房间脉冲响应(BRIR),包含通过使用至少一个反馈延迟网络(FDN)以向通道的下混应用公共晚期混响。在一些实施例中,输入信号通道在第一处理路径中被处理,以向各通道应用的用于该通道的单通道BRIR的直接响应和早期反射部分,并且,通道的下混在包含至少一个应用公共晚期混响的FDN的第二处理路径中被处理。典型地,公共晚期混响模仿单通道BRIR中的至少一些的晚期混响部分的共同宏观属性。其它方面是被配置为执行方法的任何实施例的耳机虚拟化器。

    响应于多通道音频通过使用至少一个反馈延迟网络产生双耳音频

    公开(公告)号:CN107770717A

    公开(公告)日:2018-03-06

    申请号:CN201711094047.9

    申请日:2014-12-18

    IPC分类号: H04S3/00 H04S7/00 G10L19/008

    摘要: 本公开涉及响应于多通道音频通过使用至少一个反馈延迟网络产生双耳音频。在一些实施例中,提供用于响应多通道音频信号的通道产生双耳信号的虚拟化方法,这些虚拟化方法向各通道应用双耳房间脉冲响应(BRIR),包含通过使用至少一个反馈延迟网络(FDN)以向通道的下混应用公共晚期混响。在一些实施例中,输入信号通道在第一处理路径中被处理,以向各通道应用的用于该通道的单通道BRIR的直接响应和早期反射部分,并且,通道的下混在包含至少一个应用公共晚期混响的FDN的第二处理路径中被处理。典型地,公共晚期混响模仿单通道BRIR中的至少一些的晚期混响部分的共同宏观属性。其它方面是被配置为执行方法的任何实施例的耳机虚拟化器。

    响应于多通道音频通过使用至少一个反馈延迟网络产生双耳音频

    公开(公告)号:CN105874820B

    公开(公告)日:2017-12-12

    申请号:CN201480071993.X

    申请日:2014-12-18

    IPC分类号: H04S3/00

    摘要: 在一些实施例中,提供用于响应多通道音频信号的通道产生双耳信号的虚拟化方法,这些虚拟化方法向各通道应用双耳房间脉冲响应(BRIR),包含通过使用至少一个反馈延迟网络(FDN)以向通道的下混应用公共晚期混响。在一些实施例中,输入信号通道在第一处理路径中被处理,以向各通道应用的用于该通道的单通道BRIR的直接响应和早期反射部分,并且,通道的下混在包含至少一个应用公共晚期混响的FDN的第二处理路径中被处理。典型地,公共晚期混响模仿单通道BRIR中的至少一些的晚期混响部分的共同宏观属性。其它方面是被配置为执行方法的任何实施例的耳机虚拟化器。

    用于耳机虚拟化的混响生成

    公开(公告)号:CN107258091A

    公开(公告)日:2017-10-17

    申请号:CN201680009849.2

    申请日:2016-02-11

    IPC分类号: H04S3/00 H04S7/00

    摘要: 本公开涉及用于耳机虚拟化的混响生成。描述了一种生成用于耳机虚拟化的双耳房间脉冲响应(BRIR)的一个或多个分量的方法。在该方法中,生成定向控制的反射,其中定向控制的反射对与声源定位对应的音频输入信号给予期望的感知线索。然后组合至少所生成的反射来获得BRIR的一个或多个分量。还描述了对应的系统和计算机程序产品。

    基于远端用户控制的音频信号处理

    公开(公告)号:CN106297809A

    公开(公告)日:2017-01-04

    申请号:CN201510290470.0

    申请日:2015-05-29

    IPC分类号: G10L19/008 G10L21/02

    摘要: 本文中公开的示例实施例涉及基于远端用户控制的音频信号处理。公开了一种在音频发送端设备中的处理音频信号的方法。该方法包括在当前设备处接收来自远端设备的控制参数,控制参数基于远端设备的用户输入而生成并且指定针对要被传输到远端设备的音频信号的用户偏好。该方法还包括基于所接收的控制参数来处理音频信号,以及将经处理的音频信号传输至远端设备。还公开了相应的处理音频信号的计算机程序产品和相应的设备。还公开了相应的在音频接收端设备中的处理音频信号的方法和处理音频信号的计算机程序产品以及相应的设备。

    音频信号处理
    9.
    发明公开

    公开(公告)号:CN104681034A

    公开(公告)日:2015-06-03

    申请号:CN201410185954.4

    申请日:2014-04-28

    IPC分类号: G10L21/0232 G10L25/18

    摘要: 本发明的实施例涉及音频信号处理。具体而言,公开了一种用于处理音频信号的方法,包括:针对所述音频信号的当前帧,至少部分地基于所述当前帧的频率参数,确定多个预定义频带的频带能量;通过处理所述频带能量,生成所述多个预定义频带的频带增益;以及使用预定义的频带滤波器组,基于所述频带增益生成针对所述当前帧的频点增益,所述频带滤波器组特定于所述多个预定义频带。还公开了相应的系统和计算机程序产品。

    音频处理方法及音频处理设备

    公开(公告)号:CN103165136A

    公开(公告)日:2013-06-19

    申请号:CN201110421777.1

    申请日:2011-12-15

    IPC分类号: G10L21/0208

    摘要: 描述了一种音频处理方法和音频处理设备。将单通道音频信号变换为多个第一子带信号。估计每个子带信号中的期望分量的比例和噪声分量的比例。根据每个第一子带信号来生成分别对应于多个通道的第二子带信号。每个第二子带信号包括第一分量和第二分量,该第一分量和该第二分量是通过基于多维听觉表现方法给对应的第一子带信号中的期望分量和噪声分量分别赋予空间听觉特性和不同于该空间听觉特性的感知听觉特性来获得的。将第二子带信号变换为用于以该多维听觉表现方法进行呈现的信号。通过对期望声音和噪声赋予不同的听觉特性,可以改进音频信号的可理解性。