-
公开(公告)号:CN115862657B
公开(公告)日:2023-07-28
申请号:CN202310151888.8
申请日:2023-02-22
Applicant: 科大讯飞(苏州)科技有限公司
IPC: G10L21/0232 , G10L21/0272
Abstract: 本申请公开了一种随噪增益方法和装置、车载系统、电子设备及存储介质。该方法包括获取在目标场所内采集到的音频信号;从音频信号中分离得到目标噪声信号;其中,目标噪声信号影响目标场所内的音频播放效果;提取目标噪声信号的噪声能量功率谱;基于噪声能量功率谱中频点的第一能量值,确定目标场所内的待播放音频在对应频点上是否需执行增益处理;响应于频点上需执行增益处理,基于对应频点的第一能量值和目标场所内当前播放音频的音频能量功率谱在对应频点上的第二能量值,确定待播放音频在对应频点上的增益值;基于各个频点上的增益值,对待播放音频进行增益处理。上述方案,有助于提高用户的听觉体验。
-
公开(公告)号:CN116206624A
公开(公告)日:2023-06-02
申请号:CN202310489906.3
申请日:2023-05-04
Applicant: 科大讯飞(苏州)科技有限公司
Abstract: 本申请公开了一种车辆声浪合成方法、装置、存储介质及设备,该方法包括:首先采集目标车辆的发动机控制参数,然后将该参数输入至预先构建的车辆声浪合成模型进行声浪合成处理,得到合成后的声浪,并在目标车辆内播放该合成后的声浪;其中,车辆声浪合成模型包括参数编码层、流模型、解码层。由于本申请是先基于初始化变分自编码器结构、参数变分自编码器结构,以及流模型和解码层的初始化结构,利用预先采集的普通发动机控制参数对预先采集的声浪信号进行重构训练构建了车辆声浪合成模型,提升了模型的合成声浪效果,从而在利用该车辆声浪合成模型对目标车辆的发动机控制参数进行声浪合成时,可以有效提高声浪合成效果,进而提高用户的驾驶体验。
-
公开(公告)号:CN115662470B
公开(公告)日:2023-05-26
申请号:CN202211590380.X
申请日:2022-12-12
Applicant: 科大讯飞(苏州)科技有限公司
Abstract: 本申请公开了一种音频粒子提取方法和声浪合成方法及装置、设备、介质,音频粒子提取方法包括:获取目标发动机在若干运转状态下的录音数据;分别选择各种运转状态作为目标状态,选择目标状态下的录音数据作为目标数据,并确定目标数据中各音频帧的主阶次频率;对于目标数据中各音频帧,基于由音频帧确定的中心时刻,在目标数据提取音频片段,并基于音频片段中相隔预设数值个采样周期且均过零的两个采样点,得到目标状态下目标频率的候选音频粒子;对于目标状态下各主阶次频率,基于主阶次频率的各候选音频粒子分别与参考音频粒子进行互相关,确定目标状态下主阶次频率的目标音频粒子。上述方案,能够提高音频粒子的质量,进而提高声浪合成的效果。
-
公开(公告)号:CN115938389A
公开(公告)日:2023-04-07
申请号:CN202310229563.7
申请日:2023-03-10
Applicant: 科大讯飞(苏州)科技有限公司
Abstract: 本发明公开了用于车内媒体源的音量补偿方法、装置及车辆,方法包括:捕获车内声信号,对车内声信号进行滤波,得到车内声信号中的噪声信号;对噪声信号进行处理,得到噪声信号中的第一噪声信号,其中所述第一噪声信号为平稳的噪声信号;以及基于第一噪声信号计算对车内媒体源的音源信号的音量补偿值,将音量补偿值应用于音源信号以得到该音源信号的最终音量值。本发明能够区分不同噪声,从而满足不同场景下的使用效果,有效地改善了用户的听音体验。
-
公开(公告)号:CN115862657A
公开(公告)日:2023-03-28
申请号:CN202310151888.8
申请日:2023-02-22
Applicant: 科大讯飞(苏州)科技有限公司
IPC: G10L21/0232 , G10L21/0272
Abstract: 本申请公开了一种随噪增益方法和装置、车载系统、电子设备及存储介质。该方法包括获取在目标场所内采集到的音频信号;从音频信号中分离得到目标噪声信号;其中,目标噪声信号影响目标场所内的音频播放效果;提取目标噪声信号的噪声能量功率谱;基于噪声能量功率谱中频点的第一能量值,确定目标场所内的待播放音频在对应频点上是否需执行增益处理;响应于频点上需执行增益处理,基于对应频点的第一能量值和目标场所内当前播放音频的音频能量功率谱在对应频点上的第二能量值,确定待播放音频在对应频点上的增益值;基于各个频点上的增益值,对待播放音频进行增益处理。上述方案,有助于提高用户的听觉体验。
-
公开(公告)号:CN115662470A
公开(公告)日:2023-01-31
申请号:CN202211590380.X
申请日:2022-12-12
Applicant: 科大讯飞(苏州)科技有限公司
Abstract: 本申请公开了一种音频粒子提取方法和声浪合成方法及装置、设备、介质,音频粒子提取方法包括:获取目标发动机在若干运转状态下的录音数据;分别选择各种运转状态作为目标状态,选择目标状态下的录音数据作为目标数据,并确定目标数据中各音频帧的主阶次频率;对于目标数据中各音频帧,基于由音频帧确定的中心时刻,在目标数据提取音频片段,并基于音频片段中相隔预设数值个采样周期且均过零的两个采样点,得到目标状态下目标频率的候选音频粒子;对于目标状态下各主阶次频率,基于主阶次频率的各候选音频粒子分别与参考音频粒子进行互相关,确定目标状态下主阶次频率的目标音频粒子。上述方案,能够提高音频粒子的质量,进而提高声浪合成的效果。
-
公开(公告)号:CN114512113A
公开(公告)日:2022-05-17
申请号:CN202210371934.0
申请日:2022-04-11
Applicant: 科大讯飞(苏州)科技有限公司
Abstract: 本发明提供了一种音频合成方法及相关方法和设备,音频合成方法包括:获取目标文本,并合成目标文本对应的音频;确定目标文本在情感空间中的位置;根据目标文本在情感空间中的位置以及背景音乐集中的每首背景音乐在情感空间中的位置,确定目标文本与背景音乐集中的每首背景音乐在情感空间中的距离;根据确定出的距离从背景音乐集中确定与目标文本匹配的背景音乐;将与目标文本匹配的背景音乐与目标文本对应的音频融合。经由本发明提供音频合成方法,可合成出目标文本对应的融合有背景音乐的音频,并且,由于本发明能够从背景音乐集中确定出情感与目标文本匹配的背景音乐,因此,最终能够得到融合有情感与目标文本的情感匹配的背景音乐的音频。
-
公开(公告)号:CN116206624B
公开(公告)日:2023-08-29
申请号:CN202310489906.3
申请日:2023-05-04
Applicant: 科大讯飞(苏州)科技有限公司
Abstract: 本申请公开了一种车辆声浪合成方法、装置、存储介质及设备,该方法包括:首先采集目标车辆的发动机控制参数,然后将该参数输入至预先构建的车辆声浪合成模型进行声浪合成处理,得到合成后的声浪,并在目标车辆内播放该合成后的声浪;其中,车辆声浪合成模型包括参数编码层、流模型、解码层。由于本申请是先基于初始化变分自编码器结构、参数变分自编码器结构,以及流模型和解码层的初始化结构,利用预先采集的普通发动机控制参数对预先采集的声浪信号进行重构训练构建了车辆声浪合成模型,提升了模型的合成声浪效果,从而在利用该车辆声浪合成模型对目标车辆的发动机控制参数进行声浪合成时,可以有效提高声浪合成效果,进而提高用户的驾驶体验。
-
公开(公告)号:CN115938389B
公开(公告)日:2023-07-28
申请号:CN202310229563.7
申请日:2023-03-10
Applicant: 科大讯飞(苏州)科技有限公司
Abstract: 本发明公开了用于车内媒体源的音量补偿方法、装置及车辆,方法包括:捕获车内声信号,对车内声信号进行滤波,得到车内声信号中的噪声信号;对噪声信号进行处理,得到噪声信号中的第一噪声信号,其中所述第一噪声信号为平稳的噪声信号;以及基于第一噪声信号计算对车内媒体源的音源信号的音量补偿值,将音量补偿值应用于音源信号以得到该音源信号的最终音量值。本发明能够区分不同噪声,从而满足不同场景下的使用效果,有效地改善了用户的听音体验。
-
公开(公告)号:CN114512113B
公开(公告)日:2023-04-04
申请号:CN202210371934.0
申请日:2022-04-11
Applicant: 科大讯飞(苏州)科技有限公司
Abstract: 本发明提供了一种音频合成方法及相关方法和设备,音频合成方法包括:获取目标文本,并合成目标文本对应的音频;确定目标文本在情感空间中的位置;根据目标文本在情感空间中的位置以及背景音乐集中的每首背景音乐在情感空间中的位置,确定目标文本与背景音乐集中的每首背景音乐在情感空间中的距离;根据确定出的距离从背景音乐集中确定与目标文本匹配的背景音乐;将与目标文本匹配的背景音乐与目标文本对应的音频融合。经由本发明提供音频合成方法,可合成出目标文本对应的融合有背景音乐的音频,并且,由于本发明能够从背景音乐集中确定出情感与目标文本匹配的背景音乐,因此,最终能够得到融合有情感与目标文本的情感匹配的背景音乐的音频。
-
-
-
-
-
-
-
-
-