-
公开(公告)号:CN110920513A
公开(公告)日:2020-03-27
申请号:CN201911130923.8
申请日:2019-11-19
Applicant: 清华大学苏州汽车研究院(相城) , 华研慧声(苏州)电子科技有限公司
Abstract: 本发明公开了一种电动汽车行人警示音的变时间尺度实现方法,包括如下步骤:S1,原始警示音信号的设计;S2,从所述原始警示音信号中截取一段声音信号作为种子信号进行种子信号的周期构造;S3,基于车况的变步长重采样;S4,生成实时警示音信号。该电动汽车行人警示音的变时间尺度实现方法对芯片的算力和存储空间要求不高,可使行人警示音的频率和幅值变化更好地与车辆驾驶特性相耦合,而且不仅能实现单频音效,还能实现宽频音效,宽频音效频率成分则非常丰富,使人听起来更加饱满。
-
公开(公告)号:CN114155868B
公开(公告)日:2025-05-13
申请号:CN202111442886.1
申请日:2021-11-30
Applicant: 清华大学苏州汽车研究院(相城)
IPC: G10L21/02
Abstract: 本发明公开了一种语音增强方法、装置、设备及存储介质。获取语音样本数据,并将所述语音样本数据按照设定比例拆分为训练集和验证集;其中,所述语音样本数据包括带噪语音及对应的纯净语音;基于所述训练集对设定语音增强模型进行训练;基于所述验证集对训练后的所述设定语音增强模型进行验证;将待增强语音输入验证后的所述设定语音增强模型,输出目标语音。本发明实施例提供的语音增强方法,将待增强语音输入验证后的设定语音增强模型,输出目标语音,可以改善语音增强过程中容易产生语音丢失和语音失真等损伤原始语音数据的问题,保证语音增强的效果。
-
公开(公告)号:CN113889132B
公开(公告)日:2025-02-07
申请号:CN202111326968.X
申请日:2021-11-10
Applicant: 清华大学苏州汽车研究院(相城)
Abstract: 本发明实施例公开了一种语音增强方法、装置、设备及存储介质。该方法包括:将待处理的带噪语音信号输入到目标语音增强模型中;其中,所述目标语音增强模型包含编码网络、降噪网络和解码网络;通过所述编码网络,对所述带噪语音信号执行编码操作,得到输出的编码语音特征;将所述编码语音特征输入到所述降噪网络中,得到输出的降噪语音特征;基于所述编码语音特征、降噪语音特征和所述解码网络,确定与所述带噪语音信号对应的增强语音信号。本发明实施例通过直接将带噪语音信号输入到目标语音增强模型中,解决了频域语音增强方法需要时域变换的问题,既缩短了语音增强的计算时间,又提高了语音增强的效果。
-
公开(公告)号:CN113744725B
公开(公告)日:2024-07-05
申请号:CN202110952262.8
申请日:2021-08-19
Applicant: 清华大学苏州汽车研究院(相城) , 华研慧声(苏州)电子科技有限公司
IPC: G10L15/05 , G10L15/06 , G10L15/16 , G10L15/20 , G10L21/0208 , G10L21/0232 , G10L25/30 , G10L25/24
Abstract: 本发明公开了一种语音端点检测模型的训练方法及语音降噪方法,训练方法包括以下步骤:对纯净语音信号进行预处理和端点检测,以得到语音帧和静音帧的真实标签值;加入噪声信号,得到带噪语音信号;提取带噪语音信号的特征值;隐层依据特征值对带噪语音信号进行分类,以得到语音帧和纯噪声帧的估计标签值;对估计标签值与真实标签值进行损失函数计算,根据计算结果以优化语音端点检测模型的模型参数。本发明提供的语音端点检测模型的训练方法及语音降噪方法融合了深度学习思想,构建循环神经网络模型,基于数据驱动,计算算法中需要的估计参数值,得到更准确的噪声统计分布规律,进而达到较为理想的降噪效果。
-
公开(公告)号:CN113115170B
公开(公告)日:2022-06-03
申请号:CN202110307435.0
申请日:2021-03-23
Applicant: 清华大学苏州汽车研究院(相城) , 华研慧声(苏州)电子科技有限公司
Abstract: 本发明涉及一种多类型扬声器阵列的优化布置方法,应用于车内分区域声场控制系统中,包括以下步骤:步骤一:确定车内分区域声场控制系统的电声传递函数;步骤二:依据各类扬声器的频响特性和所需优化频段确定各类扬声器对应的优化频段;步骤三:利用电声传递函数,基于各类扬声器在不同潜在布置位置的控制力增量,对各类扬声器的潜在布置位置进行优先级排序;步骤四:基于各类扬声器对应的优化频段,按照各类扬声器的潜在布置位置的优先级排序依次布置扬声器,直至已布置的扬声器构成的阵列的相对控制增量在所需优化频段内满足需求。本发明能够确定各类型扬声器的数量和位置、实现车内多类型扬声器阵列的最优布置,并保证扬声器阵列控制力最大化。
-
公开(公告)号:CN113920985A
公开(公告)日:2022-01-11
申请号:CN202110677109.9
申请日:2021-06-18
Applicant: 清华大学苏州汽车研究院(相城) , 华研慧声(苏州)电子科技有限公司
Abstract: 本发明公开了一种适用于车内语音识别系统的语音端点检测方法及模块,所述模块包括语音帧判断单元和语音帧标记单元,所述语音帧判断单元用于检测出实时音频数据中的含语音帧,所述语音帧标记单元用于根据所述语音帧判断单元的检测结果对所述实时音频数据中的含语音帧进行标记。本发明提供的适用于车内语音识别系统的语音端点检测方法及模块结合实际场景的行车工况特征,建立多特征融合的端点检测模型,采用具有维度差异的模型框架,并结合语音的语谱图像特点设计卷积核,提升了语音识别准确率。
-
公开(公告)号:CN113115170A
公开(公告)日:2021-07-13
申请号:CN202110307435.0
申请日:2021-03-23
Applicant: 清华大学苏州汽车研究院(相城) , 华研慧声(苏州)电子科技有限公司
Abstract: 本发明涉及一种多类型扬声器阵列的优化布置方法,应用于车内分区域声场控制系统中,包括以下步骤:步骤一:确定车内分区域声场控制系统的电声传递函数;步骤二:依据各类扬声器的频响特性和所需优化频段确定各类扬声器对应的优化频段;步骤三:利用电声传递函数,基于各类扬声器在不同潜在布置位置的控制力增量,对各类扬声器的潜在布置位置进行优先级排序;步骤四:基于各类扬声器对应的优化频段,按照各类扬声器的潜在布置位置的优先级排序依次布置扬声器,直至已布置的扬声器构成的阵列的相对控制增量在所需优化频段内满足需求。本发明能够确定各类型扬声器的数量和位置、实现车内多类型扬声器阵列的最优布置,并保证扬声器阵列控制力最大化。
-
公开(公告)号:CN111933101A
公开(公告)日:2020-11-13
申请号:CN202010799498.8
申请日:2020-08-11
Applicant: 清华大学苏州汽车研究院(相城) , 华研慧声(苏州)电子科技有限公司
IPC: G10K11/178 , G09B23/14 , G09B25/02
Abstract: 本发明涉及一种用于教学演示的主动噪声控制系统,包括声场装置、初级声源、次级声源、传声器、展示装置、控制器。声场装置具有空腔,用于模拟声音传播环境;初级声源设置于空腔中,基于发声信号模拟发出原始噪音信号;次级声源设置于空腔中,基于控制信号模拟发出主动控制声音信号;传声器设置于空腔中,采集叠加声音信号、将叠加声音信号转换为对应采样信号;展示装置设置于空腔外并与传声器相连接,将采样信号转换为展示信号进行展示;控制器设置于空腔外并分别与初级声源、次级声源、传声器相连接,其中集成主动噪声控制算法程序,用于输出发声信号、生成控制信号。本发明能够使学员直观、系统和快速了解主动噪声控制的效果,原理和过程。
-
公开(公告)号:CN110688956A
公开(公告)日:2020-01-14
申请号:CN201910926508.7
申请日:2019-09-27
Applicant: 清华大学苏州汽车研究院(相城) , 华研慧声(苏州)电子科技有限公司
Abstract: 本发明涉及一种用于汽车道路噪声主动控制的参考信号选择方法,其包括以下步骤:步骤1:主要噪声峰值确定:选取K个主要噪声峰值及其对应的频率;步骤2:参考点的位置优化:针对每个频率,依据常相干系数对所述参考信号进行排序;步骤3:参考点的数量优化:先依据多重相干系数增量确定每个频率对应的最优参考点数量,再利用多重相干函数确定全频带的最优参考点数量,从而获得可用参考信号。本发明系统地阐述了选择道路噪声主动控制的参考信号的方法,同时能够获得参考信号位置和数量的优化,克服了现有技术的不足。
-
公开(公告)号:CN110446136A
公开(公告)日:2019-11-12
申请号:CN201910624603.1
申请日:2019-07-11
Applicant: 华研慧声(苏州)电子科技有限公司 , 清华大学苏州汽车研究院(相城)
IPC: H04R1/20
Abstract: 本发明涉及一种车内声场分区重建系统,包括扬声器、控制器、模拟音频线、数字音频线和总线。该车内声场分区重建系统采用的控制方法为:将各扬声器的总驱动信号表示为针对各个控制区域信号的叠加形式,则当第z个控制区域切换为暗区时,将针对第z个控制区域的分区驱动信号置零;当第z个控制区域切换为明区时,利用车内声场分区重建系统的电声传递函数、总驱动信号和所有声场控制点声压来求解得到针对第z个控制区域的分区驱动信号,进而求得各扬声器对应的驱动信号。本发明保证了明区的立体声效果,该立体效果在控制区域内都可体验;由于本发明采用了驱动信号叠加的控制方式,且各驱动信号相对独立,可实现独立非联动的明暗区切换。
-
-
-
-
-
-
-
-
-