-
公开(公告)号:CN118266022A
公开(公告)日:2024-06-28
申请号:CN202280076263.3
申请日:2022-10-26
申请人: 杜比实验室特许公司
IPC分类号: G10L21/028 , G10L25/30 , G10L25/84 , G10L21/0208
摘要: 本公开涉及一种用于执行源分离的方法和音频处理系统(1)。方法包括:获得(S1)包括语音内容和噪声内容的混合的音频信号(Sin);从音频信号中确定(S2a,S2b,S2c)语音内容(式A)、平稳噪声内容(式C)和非语音内容(式B)。平稳噪声内容(式C)是非语音内容(式B)的真子集,并且方法进一步包括:基于平稳噪声内容(式C)与非语音内容(式B)之间的差异来确定(S3)非平稳噪声内容(式D);获得(S5)加权因子集合;以及基于用相应的加权因子加权的语音内容(式A)、平稳噪声内容(式C)和非平稳噪声内容(式D)的组合来形成(S6)经处理的音频信号。#imgabs0##imgabs1##imgabs2##imgabs3#
-
公开(公告)号:CN116964665A
公开(公告)日:2023-10-27
申请号:CN202280020432.1
申请日:2022-03-09
申请人: 杜比实验室特许公司
IPC分类号: G10L21/0208
摘要: 用于混响抑制的方法可以包括接收输入音频信号。该方法可以包括针对输入音频信号的至少一帧计算输入音频信号的初始混响抑制增益。该方法可以包括计算至少一个调整后的混响抑制增益,其中该至少一个调整后的混响抑制增益调整以下中的至少一项:1)基于在输入音频信号中检测到的混响强度的混响抑制衰减;2)基于在输入音频信号中检测到的房间共振量的应用于输入音频信号的不同频带的增益;或者3)基于输入音频信号的直达部分的输入音频信号的响度。该方法可以包括通过将至少一个调整后的混响抑制增益应用于输入音频信号来生成输出音频信号。
-
公开(公告)号:CN117083673A
公开(公告)日:2023-11-17
申请号:CN202280021330.1
申请日:2022-04-28
申请人: 杜比实验室特许公司
IPC分类号: G10L21/0216
摘要: 公开了情境感知音频处理的实施例。在实施例中,一种音频处理方法包括:利用设备的一个或多个传感器接收由设备捕获的音频录音的环境信息;利用设备的至少一个处理器基于音频录音和环境信息来检测音频录音的情境;利用至少一个处理器基于情境来确定模型;利用至少一个处理器基于模型来处理音频录音以产生噪声抑制的经处理的音频录音;利用至少一个处理器基于情境来确定音频处理配置文件;以及利用至少一个处理器基于音频处理配置文件将音频录音与经处理的音频录音进行组合。
-
-
公开(公告)号:CN118369669A
公开(公告)日:2024-07-19
申请号:CN202280081203.0
申请日:2022-12-08
申请人: 杜比实验室特许公司
IPC分类号: G06N3/082 , G06N3/09 , G06N3/045 , G06N3/0464 , G06N3/096
摘要: 本公开涉及一种用于设计处理器(20)的方法和一种计算机实施的神经网络。该方法包括获得输入数据和对应的基准真相目标数据并且将输入数据提供给处理器(20),以在给定输入数据的情况下输出对目标数据的第一预测。该方法进一步包括:将由处理器模块(21:1,21:2,……,21:n‑1)输出的潜在变量提供给监督器模块(22:1,22:2,22:3,……,22:n‑1),该监督器模块基于潜在变量来输出对目标数据的第二预测;以及通过将这些对目标数据的预测与基准真相目标数据进行比较来确定第一损失度量和第二损失度量。该方法进一步包括基于第一损失度量和第二损失度量来训练处理器(20)和监督器模块(22:1,22:2,22:3,……,22:n‑1),并且通过移除、替换和添加处理器模块中的至少一项操作来调整处理器。
-
公开(公告)号:CN116349252A
公开(公告)日:2023-06-27
申请号:CN202180068152.3
申请日:2021-09-15
IPC分类号: H04S1/00
摘要: 本发明涉及一种用于处理表示由双耳录音设备获取的输入双耳音频信号的第一音频信号和第二音频信号的方法和设备。本发明还涉及一种用于在扬声器系统上渲染双耳音频信号的方法。用于处理双耳信号的方法包括:从第一音频信号提取音频信息;计算用于降低第一音频信号中的噪声的频带增益;以及根据动态缩放因子对第一音频信号的相应频带应用频带增益,以提供第一输出音频信号。其中,该动态缩放因子的值在零到一之间,并且被选择为减少该第一音频信号的质量降级。
-
公开(公告)号:CN112640301A
公开(公告)日:2021-04-09
申请号:CN201980057612.5
申请日:2019-09-26
申请人: 杜比实验室特许公司
发明人: 马远星
摘要: 本申请案涉及响应于输入音频信号而动态地调整压缩器的阈值的方法、系统及计算机程序产品。场景切换分析器接收具有多个频带分量的输入音频信号。所述场景切换分析器确定所述输入音频信号中是否已发生场景切换。处理所述输入音频信号的所述频带分量。响应于确定尚未发生场景切换,失真可听度系统将缓慢平滑应用到所述频带分量的压缩器阈值。响应于确定已发生场景切换,所述失真可听度系统将快速平滑应用到所述频带分量的所述压缩器阈值或不将平滑应用到所述频带分量的所述压缩器阈值。
-
公开(公告)号:CN118922884A
公开(公告)日:2024-11-08
申请号:CN202380026675.0
申请日:2023-03-08
申请人: 杜比实验室特许公司
IPC分类号: G10L21/0208 , G10L21/0232 , G10L21/0216
摘要: 本公开涉及一种用于抑制风噪声的方法和系统(1)。该方法包括获取包括多个连续音频信号分段(101、102、103、101'、102'、103')的输入音频信号(100、101'),并且用风噪声抑制器模块(20)抑制输入音频信号中的风噪声以产生风噪声降低的音频信号。该方法还包括使用经训练以预测增益集的神经网络(10),用于降低输入音频信号(100、100')的输入音频信号(100、100')给定样本中的噪声,其中通过将所述增益集施加给输入音频信号(100、101')来形成降噪音频信号,并用混频器(30)混合风噪声降低的音频信号和降噪音频信号,以获取具有经抑制风噪声的输出音频信号。
-
公开(公告)号:CN116964666A
公开(公告)日:2023-10-27
申请号:CN202280019905.6
申请日:2022-03-10
申请人: 杜比实验室特许公司
IPC分类号: G10L21/0208
摘要: 用于抑制混响的方法可以涉及接收输入音频信号。该方法可以涉及将输入音频信号的媒体类型分类为至少包括以下各项的组中的一项:1)言语;2)音乐;或者3)音乐下的言语。该方法可以涉及至少基于确定输入音频信号的媒体类型已被分类为言语来确定是否要对输入音频信号执行去混响。该方法可以涉及响应于确定要对输入音频信号执行去混响,通过对输入音频信号执行去混响来生成输出音频信号。
-
公开(公告)号:CN114127848A
公开(公告)日:2022-03-01
申请号:CN202080051216.4
申请日:2020-07-16
申请人: 杜比实验室特许公司
IPC分类号: G10L25/60 , G10L25/18 , G10L25/30 , G10L21/0232 , G10L25/78
摘要: 本文公开了一种用于调整齿音检测器的参数的方法。从正在接收的音频信号中提取时频特征。基于这些时频特征,确定音频信号是否包括短期特征或长期特征。根据确定音频信号包括短期特征或长期特征,对用于检测音频信号中的齿音的齿音检测器的一个或多个参数进行调整。使用具有一个或多个经调整的参数的齿音检测器来检测音频信号中的齿音。
-
-
-
-
-
-
-
-
-