-
公开(公告)号:CN119296506B
公开(公告)日:2025-04-18
申请号:CN202411811412.3
申请日:2024-12-10
Applicant: 科大讯飞(苏州)科技有限公司
IPC: G10K11/178
Abstract: 本申请公开了一种车辆降噪方法、装置、存储介质及设备,该方法包括:首先将目标车辆产生的目标路噪信号输入至预先构建的固定滤波器选择模型,预测得到对目标车辆进行降噪的目标固定滤波器;其中,目标固定滤波器是从预先安装在目标车辆内部的N个固定滤波器中确定的;N个固定滤波器的参数是通过对预先采集到的N种典型工况下的路噪信号进行最优滤波器计算后确定的;固定滤波器选择模型是利用N种工况下的路噪信号和N个固定滤波器共同训练得到的;然后利用目标固定滤波器对目标路噪信号进行滤波处理,并通过车内扬声器播放滤波后得到的反相噪声控制信号,与目标路噪信号干涉相消,从而可以提高对目标车辆的降噪效果,并降低滤波器的选择成本。
-
公开(公告)号:CN117351925A
公开(公告)日:2024-01-05
申请号:CN202311659980.1
申请日:2023-12-06
Applicant: 科大讯飞(苏州)科技有限公司
IPC: G10K11/178 , G10L21/0272 , G10L25/30 , G10L21/0208
Abstract: 本发明提供一种啸叫抑制方法、装置、电子设备和存储介质,涉及音频处理技术领域。其中方法包括:获取麦克风采集的第一音频信号,以及所述第一音频信号对应的第二音频信号,所述第二音频信号为所述第一音频信号经过处理后所需输出的参考信号;将所述第一音频信号与所述第二音频信号输入至啸叫抑制模型,得到所述啸叫抑制模型输出的分离权重向量;将所述第一音频信号与所述分离权重向量进行相乘,得到目标音频信号;其中,所述啸叫抑制模型是基于训练样本和所述训练样本对应的目标音频信号标签训练得到的,所述训练样本包括样本第一音频信号和样本第二音频信号。本发明可以减少非线性失真,进而提高啸叫抑制效果,最终提高音质。
-
公开(公告)号:CN119785819A
公开(公告)日:2025-04-08
申请号:CN202411900415.4
申请日:2024-12-23
Applicant: 科大讯飞(苏州)科技有限公司
IPC: G10L21/0308 , H04S7/00
Abstract: 本发明涉及音频信号分离技术领域,提供一种音频信号分离方法、装置、电子设备及存储介质,其中方法包括:获取音频设备不同通道的音频信号所分别对应的频域信号;分解所述频域信号,获取每一通道的相干声信号和环境声信号;在所述不同通道的环境声信号对应的能量相同的情况下,依据所述不同通道的环境声信号之间的相位差异,确定每一通道的目标环境声信号;从每一通道的音频信号中分离对应通道的目标环境声信号,获取该通道的目标相干声信号。本发明提供的方法、装置、电子设备及存储介质,由混音师或者多通道算法对分离出的目标相干声信号和目标环境声信号进行二次加工,营造出更具包围感和临场感的听觉氛围,提高用户的听觉体验。
-
公开(公告)号:CN117292698A
公开(公告)日:2023-12-26
申请号:CN202311560962.8
申请日:2023-11-22
Applicant: 科大讯飞(苏州)科技有限公司
IPC: G10L21/007 , G10L21/0208 , G10L13/04
Abstract: 本申请提供一种车载音频数据的处理方法、装置和电子设备,涉及音频处理技术领域。该方法包括:基于车辆中多个音频输出位置各自对应的冲激响应确定滤波参数,并基于滤波参数确定音频补偿增益;基于滤波参数,对语音合成的初始车载音频数据进行滤波处理,并基于音频补偿增益,对滤波后的车载音频数据进行音频补偿,得到补偿后的车载音频数据;对补偿后的车载音频数据进行功率放大处理,并输出功率放大后的目标车载音频数据。这样在对车载音频数据进行功率放大处理之前,先对语音合成的初始车载音频数据进行滤波和音频补偿处理,可以有效地提高最终输出的车载音频数据的音频效果。
-
公开(公告)号:CN119811415A
公开(公告)日:2025-04-11
申请号:CN202411973957.4
申请日:2024-12-30
Applicant: 科大讯飞(苏州)科技有限公司
IPC: G10L21/0272 , G10L25/03 , G10L25/27 , G10L25/48
Abstract: 本发明涉及声音处理技术领域,提供一种声音信号分离方法、装置、电子设备和存储介质,其中方法包括:基于各通道信号的短时能量和所述各通道信号之间的互相关系数,确定环境声的短时能量,各通道的环境声具有相同的短时能量;基于所述环境声的短时能量和所述各通道信号的短时能量,确定所述各通道的环境声掩膜;基于所述各通道的环境声掩膜和所述各通道信号,确定所述各通道的环境声和相干声。本发明利用每个通道的环境声掩膜,可以有效地将环境声和相干声分离出来,提高了分离效果,可适用于多种立体声场景。
-
公开(公告)号:CN119741935A
公开(公告)日:2025-04-01
申请号:CN202411779092.8
申请日:2024-12-05
Applicant: 科大讯飞(苏州)科技有限公司
IPC: G10L21/0272 , G10L21/0308
Abstract: 本发明涉及声音处理技术领域,提供一种声音分离方法、装置、电子设备和存储介质,方法包括:获取第一声音信号和第二声音信号;基于第一声音信号和第二声音信号各自的短时能量值,以及第一声音信号和第二声音信号各自所包含环境声和相干声间的线性组合关系,确定环境声和相干声各自的短时能量值,以及相干声在不同通道上的差异因子;基于权重映射关系,将环境声和相干声各自的短时能量值,以及差异因子,映射为声音分离权重,权重映射关系是基于线性组合关系进行线性拟合得到的;基于声音分离权重,从第一声音信号和第二声音信号中分离出环境声和相干声。本发明提供的方法、装置、电子设备和存储介质,保证了环境声和相干声分离的有效性和可靠性。
-
公开(公告)号:CN117351925B
公开(公告)日:2024-04-12
申请号:CN202311659980.1
申请日:2023-12-06
Applicant: 科大讯飞(苏州)科技有限公司
IPC: G10K11/178 , G10L21/0272 , G10L25/30 , G10L21/0208
Abstract: 本发明提供一种啸叫抑制方法、装置、电子设备和存储介质,涉及音频处理技术领域。其中方法包括:获取麦克风采集的第一音频信号,以及所述第一音频信号对应的第二音频信号,所述第二音频信号为所述第一音频信号经过处理后所需输出的参考信号;将所述第一音频信号与所述第二音频信号输入至啸叫抑制模型,得到所述啸叫抑制模型输出的分离权重向量;将所述第一音频信号与所述分离权重向量进行相乘,得到目标音频信号;其中,所述啸叫抑制模型是基于训练样本和所述训练样本对应的目标音频信号标签训练得到的,所述训练样本包括样本第一音频信号和样本第二音频信号。本发明可以减少非线性失真,进而提高啸叫抑制效果,最终提高音质。
-
公开(公告)号:CN117765912A
公开(公告)日:2024-03-26
申请号:CN202311629578.9
申请日:2023-11-30
Applicant: 科大讯飞(苏州)科技有限公司
IPC: G10K11/178
Abstract: 本发明提供一种汽车噪声消除方法、装置、汽车、电子设备和存储介质,涉及噪声消除技术领域。方法包括:基于目标汽车的振动信号,以及目标汽车的运行状态,确定输入信号;将输入信号输入至噪声消除模型中的特征提取层,得到特征提取层输出的特征张量;将特征张量输入至噪声消除模型中的信号生成层,得到信号生成层输出的降噪信号;输出降噪信号;其中,特征提取层包括非线性激活函数层,非线性激活函数层用于提取输入信号的非线性特征张量;噪声消除模型是基于样本输入信号和样本输入信号对应的标签信号训练得到的,样本输入信号是基于样本振动信号和样本运行状态确定的。本发明可以有效消除非线性噪声,提高降噪效果。
-
公开(公告)号:CN117153192B
公开(公告)日:2024-02-20
申请号:CN202311413048.0
申请日:2023-10-30
Applicant: 科大讯飞(苏州)科技有限公司
Abstract: 本发明提供一种音频增强方法、装置、电子设备和存储介质,涉及音频处理技术领域。其中方法包括:对待增强音频信号进行相干声提取,得到相干声信号和环境声信号;在相干声信号与环境声信号的互相关系数小于预设相关系数阈值的情况下,基于环境声信号确定目标音频增强阈值;在相干声信号与环境声信号的互相关系数大于或等于预设相关系数阈值的情况下,基于预设音频增强阈值确定目标音频增强阈值;基于至少一个音频增强参数和目标音频增强阈值,对待增强音频信号进行增强处理,得到增强音频信号。本发明根据待增强音频信号的变化实时动态更新目标音频增强阈值,从而可以更好地控制音频源各个成分的增强效果,进而提高用户听感,最终提高用户体验感。
-
公开(公告)号:CN119584014A
公开(公告)日:2025-03-07
申请号:CN202411532385.6
申请日:2024-10-30
Applicant: 科大讯飞(苏州)科技有限公司
IPC: H04R3/00
Abstract: 本申请提供一种音频信号处理方法、计算机设备及存储介质,其中,该方法包括:获取初始音频信号;基于多个音区对应的滤波器系数,确定至少一个目标音区对应的目标滤波器系数,其中,所述滤波器系数是由神经网络模型基于所述多个音区内音频输入设备接收的冲激响应数据训练得到,所述目标音区为所述多个音区中的一个或一个以上音区;根据至少一个所述目标音区对应的所述目标滤波器系数,对所述初始音频信号进行滤波处理,获得至少一个目标音频信号;将每个所述目标音频信号向对应的所述目标音区传输。由此可以实现音频分区播放的效果,提高了音频输出的智能性。
-
-
-
-
-
-
-
-
-