信号处理中的源分离和再混合
    1.
    发明公开

    公开(公告)号:CN118266022A

    公开(公告)日:2024-06-28

    申请号:CN202280076263.3

    申请日:2022-10-26

    摘要: 本公开涉及一种用于执行源分离的方法和音频处理系统(1)。方法包括:获得(S1)包括语音内容和噪声内容的混合的音频信号(Sin);从音频信号中确定(S2a,S2b,S2c)语音内容(式A)、平稳噪声内容(式C)和非语音内容(式B)。平稳噪声内容(式C)是非语音内容(式B)的真子集,并且方法进一步包括:基于平稳噪声内容(式C)与非语音内容(式B)之间的差异来确定(S3)非平稳噪声内容(式D);获得(S5)加权因子集合;以及基于用相应的加权因子加权的语音内容(式A)、平稳噪声内容(式C)和非平稳噪声内容(式D)的组合来形成(S6)经处理的音频信号。#imgabs0##imgabs1##imgabs2##imgabs3#

    提高去混响的感知质量
    2.
    发明公开

    公开(公告)号:CN116964665A

    公开(公告)日:2023-10-27

    申请号:CN202280020432.1

    申请日:2022-03-09

    发明人: 马远星 李凯

    IPC分类号: G10L21/0208

    摘要: 用于混响抑制的方法可以包括接收输入音频信号。该方法可以包括针对输入音频信号的至少一帧计算输入音频信号的初始混响抑制增益。该方法可以包括计算至少一个调整后的混响抑制增益,其中该至少一个调整后的混响抑制增益调整以下中的至少一项:1)基于在输入音频信号中检测到的混响强度的混响抑制衰减;2)基于在输入音频信号中检测到的房间共振量的应用于输入音频信号的不同频带的增益;或者3)基于输入音频信号的直达部分的输入音频信号的响度。该方法可以包括通过将至少一个调整后的混响抑制增益应用于输入音频信号来生成输出音频信号。

    情境感知音频处理
    3.
    发明公开

    公开(公告)号:CN117083673A

    公开(公告)日:2023-11-17

    申请号:CN202280021330.1

    申请日:2022-04-28

    IPC分类号: G10L21/0216

    摘要: 公开了情境感知音频处理的实施例。在实施例中,一种音频处理方法包括:利用设备的一个或多个传感器接收由设备捕获的音频录音的环境信息;利用设备的至少一个处理器基于音频录音和环境信息来检测音频录音的情境;利用至少一个处理器基于情境来确定模型;利用至少一个处理器基于模型来处理音频录音以产生噪声抑制的经处理的音频录音;利用至少一个处理器基于情境来确定音频处理配置文件;以及利用至少一个处理器基于音频处理配置文件将音频录音与经处理的音频录音进行组合。

    双耳录音中语音的检测和增强
    4.
    发明公开

    公开(公告)号:CN116745844A

    公开(公告)日:2023-09-12

    申请号:CN202280009447.8

    申请日:2022-01-12

    IPC分类号: G10L25/87

    摘要: 本文公开了用于将语音的双耳录音分段成包含自身语音的部分和包含外部语音的部分,并使用不同设置处理每个种类以获得增强的整体呈现的方法、系统和计算机程序产品。基于以下组合进行分段:i)基于特征的逐帧分类,和ii)通过统计方法检测相异度。分段信息随后被语音增强链使用,其中独立设置用于处理自身语音部分和外部语音部分。

    用于利用多个监督器进行神经网络训练的方法

    公开(公告)号:CN118369669A

    公开(公告)日:2024-07-19

    申请号:CN202280081203.0

    申请日:2022-12-08

    摘要: 本公开涉及一种用于设计处理器(20)的方法和一种计算机实施的神经网络。该方法包括获得输入数据和对应的基准真相目标数据并且将输入数据提供给处理器(20),以在给定输入数据的情况下输出对目标数据的第一预测。该方法进一步包括:将由处理器模块(21:1,21:2,……,21:n‑1)输出的潜在变量提供给监督器模块(22:1,22:2,22:3,……,22:n‑1),该监督器模块基于潜在变量来输出对目标数据的第二预测;以及通过将这些对目标数据的预测与基准真相目标数据进行比较来确定第一损失度量和第二损失度量。该方法进一步包括基于第一损失度量和第二损失度量来训练处理器(20)和监督器模块(22:1,22:2,22:3,……,22:n‑1),并且通过移除、替换和添加处理器模块中的至少一项操作来调整处理器。

    用于处理双耳录音的方法和设备
    6.
    发明公开

    公开(公告)号:CN116349252A

    公开(公告)日:2023-06-27

    申请号:CN202180068152.3

    申请日:2021-09-15

    IPC分类号: H04S1/00

    摘要: 本发明涉及一种用于处理表示由双耳录音设备获取的输入双耳音频信号的第一音频信号和第二音频信号的方法和设备。本发明还涉及一种用于在扬声器系统上渲染双耳音频信号的方法。用于处理双耳信号的方法包括:从第一音频信号提取音频信息;计算用于降低第一音频信号中的噪声的频带增益;以及根据动态缩放因子对第一音频信号的相应频带应用频带增益,以提供第一输出音频信号。其中,该动态缩放因子的值在零到一之间,并且被选择为减少该第一音频信号的质量降级。

    具有基于场景切换分析器引导的失真可听度模型的动态阈值的减少失真的多带压缩器

    公开(公告)号:CN112640301A

    公开(公告)日:2021-04-09

    申请号:CN201980057612.5

    申请日:2019-09-26

    发明人: 马远星

    IPC分类号: H03G9/00 H03G9/18

    摘要: 本申请案涉及响应于输入音频信号而动态地调整压缩器的阈值的方法、系统及计算机程序产品。场景切换分析器接收具有多个频带分量的输入音频信号。所述场景切换分析器确定所述输入音频信号中是否已发生场景切换。处理所述输入音频信号的所述频带分量。响应于确定尚未发生场景切换,失真可听度系统将缓慢平滑应用到所述频带分量的压缩器阈值。响应于确定已发生场景切换,所述失真可听度系统将快速平滑应用到所述频带分量的所述压缩器阈值或不将平滑应用到所述频带分量的所述压缩器阈值。

    用于风噪声抑制的方法和音频处理系统

    公开(公告)号:CN118922884A

    公开(公告)日:2024-11-08

    申请号:CN202380026675.0

    申请日:2023-03-08

    摘要: 本公开涉及一种用于抑制风噪声的方法和系统(1)。该方法包括获取包括多个连续音频信号分段(101、102、103、101'、102'、103')的输入音频信号(100、101'),并且用风噪声抑制器模块(20)抑制输入音频信号中的风噪声以产生风噪声降低的音频信号。该方法还包括使用经训练以预测增益集的神经网络(10),用于降低输入音频信号(100、100')的输入音频信号(100、100')给定样本中的噪声,其中通过将所述增益集施加给输入音频信号(100、101')来形成降噪音频信号,并用混频器(30)混合风噪声降低的音频信号和降噪音频信号,以获取具有经抑制风噪声的输出音频信号。

    基于媒体类型的去混响
    9.
    发明公开

    公开(公告)号:CN116964666A

    公开(公告)日:2023-10-27

    申请号:CN202280019905.6

    申请日:2022-03-10

    IPC分类号: G10L21/0208

    摘要: 用于抑制混响的方法可以涉及接收输入音频信号。该方法可以涉及将输入音频信号的媒体类型分类为至少包括以下各项的组中的一项:1)言语;2)音乐;或者3)音乐下的言语。该方法可以涉及至少基于确定输入音频信号的媒体类型已被分类为言语来确定是否要对输入音频信号执行去混响。该方法可以涉及响应于确定要对输入音频信号执行去混响,通过对输入音频信号执行去混响来生成输出音频信号。