-
公开(公告)号:CN112086106A
公开(公告)日:2020-12-15
申请号:CN202010802750.6
申请日:2020-08-11
申请人: 北京声智科技有限公司
IPC分类号: G10L25/51 , G10L21/0316 , G01H17/00
摘要: 本申请涉及一种测试场景对齐方法、装置、介质和设备。根据本申请提供的方案,获得参考测试场景和待测试场景中的信号信息;其中,所述信号信息包括以下中的至少一种:指定频率的校准音频信号在所述参考测试场景和所述待测试场景中的声压值、待分析音频信号;其中,待分析音频信号包括在参考测试场景中对指定音频信号进行录制得到的参考音频信号以及在待测试场景中对指定音频信号进行录制得到的待校正音频信号;根据获取到的信号信息执行场景对齐操作;其中,声压值用于对齐所述待测试场景和所述参考测试场景的声压,待分析音频信号用于对齐所述待测试场景和所述参考测试场景的幅值。通过该方法,用以解决如何提高对齐测试场景的准确性的问题。
-
公开(公告)号:CN112002335A
公开(公告)日:2020-11-27
申请号:CN202010736790.5
申请日:2011-12-01
申请人: 杜比实验室特许公司
发明人: 杰弗里·里德米勒 , 雷古纳森·拉达克里希南 , 马文·普里巴迪 , 法哈德·法哈尼 , 迈克尔·史密瑟斯
IPC分类号: G10L19/008 , G10L19/16 , G10L21/0316 , H04L9/06 , H04L9/32
摘要: 本申请公开一种音频解码方法、音频解码装置、包括软件程序的存储介质和用于处理媒体数据的方法。该音频解码方法,包括:通过音频解码器获得经编码的比特流,所述经编码的比特流包括音频数据和信令数据,所述信令数据指示所述经编码的比特流中包括响度值,并且还指示所述经编码的比特流中包括样本峰数据;通过所述音频解码器从所述经编码的比特流获得所述响度值和所述样本峰数据;以及通过所述音频解码器响应于所述响度值和所述样本峰数据来对所述音频数据的响度进行标准化。
-
公开(公告)号:CN112002334A
公开(公告)日:2020-11-27
申请号:CN202010736784.X
申请日:2011-12-01
申请人: 杜比实验室特许公司
发明人: 杰弗里·里德米勒 , 雷古纳森·拉达克里希南 , 马文·普里巴迪 , 法哈德·法哈尼 , 迈克尔·史密瑟斯
IPC分类号: G10L19/008 , G10L19/16 , G10L21/0316 , H04L9/06 , H04L9/32
摘要: 本申请公开一种音频解码方法、音频解码装置、包括软件程序的存储介质和用于处理媒体数据的方法。该音频解码方法,包括:通过音频解码器获得经编码的比特流,所述经编码的比特流包括音频数据和信令数据,所述信令数据指示所述经编码的比特流中包括响度值,并且还指示所述经编码的比特流中包括真正的峰数据;通过所述音频解码器从所述经编码的比特流获得所述响度值和所述真正的峰数据;以及通过所述音频解码器响应于所述响度值和所述真正的峰数据来对所述音频数据的响度进行标准化。
-
公开(公告)号:CN107452389B
公开(公告)日:2020-09-01
申请号:CN201710594168.3
申请日:2017-07-20
申请人: 大象声科(深圳)科技有限公司
IPC分类号: G10L19/02 , G10L21/0208 , G10L21/0316 , G10L21/0332 , G10L25/30
摘要: 本发明涉及一种通用的单声道实时降噪方法,包括以下步骤:接收电子格式的带噪语音,其中包含语音和非人声干扰噪声;从接收到的声音中逐帧提取短时傅里叶幅度谱作为声学特征;使用具有长短期记忆的深度回归神经网络逐帧产生比值膜;利用产生的比值膜对带噪语音的幅度谱进行掩蔽;使用掩蔽后的幅度谱和带噪语音的原始相位,经过逆傅里叶变换,再次合成语音波形。本发明采用有监督学习方法进行语音降噪,通过使用带有长短期记忆的回归神经网络来估计理想比值膜;本发明提出的回归神经网络使用大量带噪语音进行训练,其中包含了各种现实声学场景和麦克风脉冲响应,最终实现了独立于背景噪声、说话人和传输信道的通用语音降噪。
-
公开(公告)号:CN111415673A
公开(公告)日:2020-07-14
申请号:CN202010004297.4
申请日:2020-01-03
申请人: 哈曼国际工业有限公司
IPC分类号: G10L21/007 , G10L21/0316 , A61B5/12
摘要: 一种音频信号处理的方法,所述方法包括:访问特定用户的用户特定音频处理信息;确定用于从音频信号产生声音输出的音频装置的身份信息;基于所述音频装置的所述身份信息,访问所述音频装置的装置特定音频处理信息;基于所述用户特定音频处理信息和所述装置特定音频处理信息而生成所述音频信号的定制的音频处理过程;以及通过利用所述定制的音频处理过程处理所述音频信号来生成定制的音频信号。
-
公开(公告)号:CN111383629A
公开(公告)日:2020-07-07
申请号:CN202010199908.5
申请日:2020-03-20
申请人: 深圳市未艾智能有限公司
发明人: 张铖
IPC分类号: G10L15/06 , G10L15/26 , G10L21/0216 , G10L21/0316
摘要: 本公开实施例公开了语音处理方法和装置、电子设备以及存储介质。该方法的一具体实施方式包括:对于麦克风阵列采集的待处理语音数据中的每帧语音数据,计算该帧语音数据对应的到来角;基于待处理语音数据中各帧语音数据对应的到来角,对高斯混合模型和目标声源标识集合进行估计更新,确定待处理语音数据中各帧语音数据对应的到来角对应的声源标识;将目标声源标识集合的各目标声源标识和环境噪声声源标识中对应的到来角数量最多的声源标识确定为主声源标识;响应于确定主声源标识不是环境噪声声源标识,对待处理语音数据进行自动增益控制后输出。该实施方式实现了针对目标声源动态调整增益,环境噪声声源不会影响自动增益控制的效果。
-
公开(公告)号:CN107370898B
公开(公告)日:2020-07-07
申请号:CN201610309684.2
申请日:2016-05-11
申请人: 华为终端有限公司
IPC分类号: H04M19/04 , G10L21/0316
摘要: 本发明实施例涉及铃音播放方法和终端,该方法包括:当终端检测到来电信息时,采集环境噪声信号;对环境噪声信号进行分析,得到环境噪声信号的频谱或功率谱或能量谱;从终端存储的多个铃音中,选择与环境噪声信号的频谱或功率谱或能量谱差异最大的一个铃音,作为待播放铃音;以及,根据环境噪声信号的频谱或功率谱或能量谱的幅频特性,将第一频率范围划分为第一频段集合,为第一频段集合中的每个频段分别确定相应的滤波器增益,从而构建一个滤波器;使用滤波器处理待播放铃音;播放滤波器处理后的待播放铃音。由上可见,本发明实施例提供的方案可以有效地提高用户在吵闹环境下听见铃音的几率。
-
公开(公告)号:CN111370007A
公开(公告)日:2020-07-03
申请号:CN202010164205.9
申请日:2014-03-27
申请人: 苹果公司
发明人: F·鲍姆加特 , E·A·阿拉曼彻 , S·K·O·斯特罗默尔
IPC分类号: G10L19/008 , G10L21/0316
摘要: 本申请涉及用于响度和动态范围控制的元数据。向音频信号应用音频归一化增益值以产生归一化信号。处理该归一化信号以根据若干个预定义的DRC特性中的所选择的一个预定义的DRC特性来计算动态范围控制(DRC)增益值。对音频信号进行编码,并且提供DRC增益值作为与经编码的音频信号相关联的元数据。还描述了若干个其它实施例并要求对其进行保护。
-
公开(公告)号:CN111369979A
公开(公告)日:2020-07-03
申请号:CN202010120768.8
申请日:2020-02-26
申请人: 广州市百果园信息技术有限公司
发明人: 罗海斯·马尔斯
IPC分类号: G10L15/06 , G10L21/0224 , G10L21/0316 , G10L25/27 , G10L15/04
摘要: 本申请公开了一种训练样本获取方法、装置、设备及计算机存储介质,属于深度学习技术领域。所述方法包括:从训练样本库中获取多个样本对,所述训练样本库中包括多个有效语音样本以及多个背景噪声样本,每个所述样本对包括所述训练样本库中的两个样本;确定每个所述样本对中两个样本的权值,每个所述样本对中两个样本的权值的和为1;根据每个样本对中两个样本的权值,将每个样本对中的两个样本叠加,得到多个训练样本。解决了相关技术中获取训练样本的过程较为缓慢,难以获取大量的训练样本的问题。达到了提高训练样本获取速度以及丰富训练样本的效果。
-
公开(公告)号:CN110956973A
公开(公告)日:2020-04-03
申请号:CN201811130274.7
申请日:2018-09-27
申请人: 深圳市冠旭电子股份有限公司
IPC分类号: G10L21/0208 , G10L21/0216 , G10L21/0316
摘要: 本发明属于信号处理技术领域,提供一种回声消除方法、装置及智能终端,该方法包括:获取与扬声器输入端连接的N个音频通道中对应的N个第一音频信号;其中,所述N≧2且为整数;将所述N个第一音频信号进行线性变换后合成一个第二音频信号,将所述第二音频信号作为回声消除的参考信号;获取麦克风采集的第三音频信号,根据所述参考信号对所述第三音频信号进行回声消除后生成第四音频信号。本发明实施例无需分别对多个音频通道中的音频信号进行多次回声消除,提高了回声消除的效率,将多个音频通道中的音频信号合成一个音频信号作为回声消除的参考信号,能更准确的模拟回声音频信号,可提高消除回声后扬声器输出的音质。
-
-
-
-
-
-
-
-
-