测试场景对齐方法、装置、介质和设备

    公开(公告)号:CN112086106A

    公开(公告)日:2020-12-15

    申请号:CN202010802750.6

    申请日:2020-08-11

    摘要: 本申请涉及一种测试场景对齐方法、装置、介质和设备。根据本申请提供的方案,获得参考测试场景和待测试场景中的信号信息;其中,所述信号信息包括以下中的至少一种:指定频率的校准音频信号在所述参考测试场景和所述待测试场景中的声压值、待分析音频信号;其中,待分析音频信号包括在参考测试场景中对指定音频信号进行录制得到的参考音频信号以及在待测试场景中对指定音频信号进行录制得到的待校正音频信号;根据获取到的信号信息执行场景对齐操作;其中,声压值用于对齐所述待测试场景和所述参考测试场景的声压,待分析音频信号用于对齐所述待测试场景和所述参考测试场景的幅值。通过该方法,用以解决如何提高对齐测试场景的准确性的问题。

    一种通用的单声道实时降噪方法

    公开(公告)号:CN107452389B

    公开(公告)日:2020-09-01

    申请号:CN201710594168.3

    申请日:2017-07-20

    发明人: 陈纪同 张学良

    摘要: 本发明涉及一种通用的单声道实时降噪方法,包括以下步骤:接收电子格式的带噪语音,其中包含语音和非人声干扰噪声;从接收到的声音中逐帧提取短时傅里叶幅度谱作为声学特征;使用具有长短期记忆的深度回归神经网络逐帧产生比值膜;利用产生的比值膜对带噪语音的幅度谱进行掩蔽;使用掩蔽后的幅度谱和带噪语音的原始相位,经过逆傅里叶变换,再次合成语音波形。本发明采用有监督学习方法进行语音降噪,通过使用带有长短期记忆的回归神经网络来估计理想比值膜;本发明提出的回归神经网络使用大量带噪语音进行训练,其中包含了各种现实声学场景和麦克风脉冲响应,最终实现了独立于背景噪声、说话人和传输信道的通用语音降噪。

    语音处理方法和装置、电子设备以及存储介质

    公开(公告)号:CN111383629A

    公开(公告)日:2020-07-07

    申请号:CN202010199908.5

    申请日:2020-03-20

    发明人: 张铖

    摘要: 本公开实施例公开了语音处理方法和装置、电子设备以及存储介质。该方法的一具体实施方式包括:对于麦克风阵列采集的待处理语音数据中的每帧语音数据,计算该帧语音数据对应的到来角;基于待处理语音数据中各帧语音数据对应的到来角,对高斯混合模型和目标声源标识集合进行估计更新,确定待处理语音数据中各帧语音数据对应的到来角对应的声源标识;将目标声源标识集合的各目标声源标识和环境噪声声源标识中对应的到来角数量最多的声源标识确定为主声源标识;响应于确定主声源标识不是环境噪声声源标识,对待处理语音数据进行自动增益控制后输出。该实施方式实现了针对目标声源动态调整增益,环境噪声声源不会影响自动增益控制的效果。

    铃音播放方法、终端及其存储介质

    公开(公告)号:CN107370898B

    公开(公告)日:2020-07-07

    申请号:CN201610309684.2

    申请日:2016-05-11

    发明人: 杨枭 李芳庆

    IPC分类号: H04M19/04 G10L21/0316

    摘要: 本发明实施例涉及铃音播放方法和终端,该方法包括:当终端检测到来电信息时,采集环境噪声信号;对环境噪声信号进行分析,得到环境噪声信号的频谱或功率谱或能量谱;从终端存储的多个铃音中,选择与环境噪声信号的频谱或功率谱或能量谱差异最大的一个铃音,作为待播放铃音;以及,根据环境噪声信号的频谱或功率谱或能量谱的幅频特性,将第一频率范围划分为第一频段集合,为第一频段集合中的每个频段分别确定相应的滤波器增益,从而构建一个滤波器;使用滤波器处理待播放铃音;播放滤波器处理后的待播放铃音。由上可见,本发明实施例提供的方案可以有效地提高用户在吵闹环境下听见铃音的几率。

    用于响度和动态范围控制的元数据

    公开(公告)号:CN111370007A

    公开(公告)日:2020-07-03

    申请号:CN202010164205.9

    申请日:2014-03-27

    申请人: 苹果公司

    IPC分类号: G10L19/008 G10L21/0316

    摘要: 本申请涉及用于响度和动态范围控制的元数据。向音频信号应用音频归一化增益值以产生归一化信号。处理该归一化信号以根据若干个预定义的DRC特性中的所选择的一个预定义的DRC特性来计算动态范围控制(DRC)增益值。对音频信号进行编码,并且提供DRC增益值作为与经编码的音频信号相关联的元数据。还描述了若干个其它实施例并要求对其进行保护。

    训练样本获取方法、装置、设备及计算机存储介质

    公开(公告)号:CN111369979A

    公开(公告)日:2020-07-03

    申请号:CN202010120768.8

    申请日:2020-02-26

    摘要: 本申请公开了一种训练样本获取方法、装置、设备及计算机存储介质,属于深度学习技术领域。所述方法包括:从训练样本库中获取多个样本对,所述训练样本库中包括多个有效语音样本以及多个背景噪声样本,每个所述样本对包括所述训练样本库中的两个样本;确定每个所述样本对中两个样本的权值,每个所述样本对中两个样本的权值的和为1;根据每个样本对中两个样本的权值,将每个样本对中的两个样本叠加,得到多个训练样本。解决了相关技术中获取训练样本的过程较为缓慢,难以获取大量的训练样本的问题。达到了提高训练样本获取速度以及丰富训练样本的效果。

    一种回声消除方法、装置及智能终端

    公开(公告)号:CN110956973A

    公开(公告)日:2020-04-03

    申请号:CN201811130274.7

    申请日:2018-09-27

    摘要: 本发明属于信号处理技术领域,提供一种回声消除方法、装置及智能终端,该方法包括:获取与扬声器输入端连接的N个音频通道中对应的N个第一音频信号;其中,所述N≧2且为整数;将所述N个第一音频信号进行线性变换后合成一个第二音频信号,将所述第二音频信号作为回声消除的参考信号;获取麦克风采集的第三音频信号,根据所述参考信号对所述第三音频信号进行回声消除后生成第四音频信号。本发明实施例无需分别对多个音频通道中的音频信号进行多次回声消除,提高了回声消除的效率,将多个音频通道中的音频信号合成一个音频信号作为回声消除的参考信号,能更准确的模拟回声音频信号,可提高消除回声后扬声器输出的音质。