-
公开(公告)号:CN117935853A
公开(公告)日:2024-04-26
申请号:CN202311726562.X
申请日:2023-12-14
申请人: 浙江大华技术股份有限公司
摘要: 本申请公开了一种墙体检测方法、终端设备及存储介质,该墙体的类型检测方法包括:获取待检测音频信息,待检测音频信息为墙体拆除过程中采集得到;将待检测音频信息输入至音频判据模型,得到音频判据信息;其中,音频判据模型由样本音频数据进行特征提取得到的特征信息构建形成,样本音频数据为不同类型的墙体采用不同的拆除作业方式时分别采集得到;基于音频判据信息,确定墙体的类型。上述方案,利用不同墙体采用不同拆除作业方式采集得到的声音特征与待检测音频信息之间的关系,更准确地确定出墙体的类型。
-
公开(公告)号:CN117935832A
公开(公告)日:2024-04-26
申请号:CN202311777320.3
申请日:2023-12-21
申请人: 浙江大华技术股份有限公司
IPC分类号: G10L21/0208 , G10L21/0264 , G10L21/0216
摘要: 本申请公开了一种语音增强方法、语音增强装置以及计算机存储介质,该方法包括:获取当前帧的待增强语音;基于待增强语音上一帧的观测信号协方差矩阵的逆矩阵以及遗忘因子获取待增强语音的观测信号协方差矩阵的逆矩阵;基于待增强语音的语音信号协方差矩阵以及待增强语音上一帧的语音信号协方差矩阵中的最大特征向量得到待增强语音的语音信号协方差矩阵中的最大特征向量;基于待增强语音的观测信号协方差矩阵逆矩阵和待增强语音的语音信号协方差矩阵中的最大特征向量得到待增强语音的增强权重;使用增强权重对待增强语音进行增强。通过上述方式,无需考虑声源角度等信息就能得到待增强语音的声源特征信息,并计算增强权重实现对待增强语音的增强。
-
公开(公告)号:CN118280381A
公开(公告)日:2024-07-02
申请号:CN202410233018.X
申请日:2024-02-29
申请人: 浙江大华技术股份有限公司
IPC分类号: G10L21/0208 , H04M9/08
摘要: 本申请公开了一种噪声抑制方法、装置、设备及存储介质,该噪声抑制方法包括:确定带噪语音中各个位置存在语音的概率,得到语音存在概率;利用语音存在概率计算带噪语音对应的噪声信号谱,基于噪声信号谱计算得到带噪语音对应的先验信噪比;基于先验信噪比计算带噪语音对应的初始增益,以及,基于先验信噪比设定带噪语音对应的增益阈值;采用增益阈值对初始增益进行修正,得到目标增益;按照目标增益对带噪语音进行噪声抑制,得到语音保留结果。可以结合先验信噪比计算结果,给初始增益增加阈值控制,能够更好地适应不同的信噪比场景,提高增益计算的准确性,从而达到在噪声抑制中加强语音保留的目的。
-
公开(公告)号:CN115988385A
公开(公告)日:2023-04-18
申请号:CN202211730511.X
申请日:2022-12-30
申请人: 浙江大华技术股份有限公司
IPC分类号: H04R3/00
摘要: 本申请公开了一种音量调节方法、装置、电子设备及存储介质,确定待音量调节设备与正前方障碍物的距离、所述待音量调节设备所处环境的空间尺寸;根据所述待音量调节设备所处环境的空间尺寸,确定混响时间;根据所述混响时间,确定声压级差异值;获取录制的环境噪声的声音能量,根据所述声音能量和预先标定的声音能量,确定最小音量值;获取待播放音源的声音能量,根据预先标定的声压级、所述待播放音源的声音能量、所述待音量调节设备与正前方障碍物的距离和所述声压级差异值,确定所述障碍物处的音量值;根据所述音量值与所述最小音量值的差值,对所述待音量调节设备进行音量调节。实现了一种自适应音量调节的方案。
-
公开(公告)号:CN117935836A
公开(公告)日:2024-04-26
申请号:CN202311776034.5
申请日:2023-12-21
申请人: 浙江大华技术股份有限公司
IPC分类号: G10L21/0224 , G10L21/0232 , G10L21/0208 , G10L21/0216
摘要: 本公开涉及一种回声消除方法、装置及设备,该方法包括:获取当前帧远端信号和多个近端信号;基于前一帧各通道的各滤波器子块的第一滤波器系数、远端信号和多个近端信号,得到各通道的第一残差信号;基于各通道的第一残差信号确定近端语音协方差矩阵;基于任一通道的各滤波器子块的状态协方差矩阵、远端信号和近端语音协方差矩阵,确定任一通道的各滤波器子块的目标步长;基于任一通道的各滤波器子块的目标步长确定当前帧各通道的各滤波器子块的第二滤波器系数;基于当前帧各通道的各滤波器子块的第二滤波器系数、后一帧远端信号和各通道的近端信号,确定后一帧各通道的第二残差信号。本公开能保证较好回声消除效果,降低回声消除的计算复杂度。
-
公开(公告)号:CN117935833A
公开(公告)日:2024-04-26
申请号:CN202311779394.0
申请日:2023-12-21
申请人: 浙江大华技术股份有限公司
IPC分类号: G10L21/0208 , G10L21/0264 , G10L21/0216
摘要: 本申请公开了一种语音增强方法、设备及存储介质,该语音增强方法包括:对待处理音频信号进行加性噪声抑制处理,确定待处理音频信号进行加性噪声抑制处理采用的语音估计增益系数;提取待处理音频信号对应的基音频率,根据基音频率确定平滑系数;按照平滑系数对语音估计增益系数进行平滑,得到平滑增益系数;根据平滑增益系数对待处理音频信号进行语音增强,得到目标纯净语音信号。可以在抑制加性噪声的前提下,有效抑制因为噪声抑制不准确造成的残余噪声,且根据基音频率确定的平滑系数可以避免语音失真。
-
公开(公告)号:CN117935831A
公开(公告)日:2024-04-26
申请号:CN202311777130.1
申请日:2023-12-21
申请人: 浙江大华技术股份有限公司
IPC分类号: G10L21/0208 , G10L21/0264 , G10L21/0216 , G10L25/30
摘要: 本申请公开了一种语音增强网络的训练方法、语音增强方法、电子设备及计算机可读存储介质。该方法包括获取带噪语音信号和无噪语音信号,带噪语音信号基于带噪语音得到,无噪语音信号基于无噪语音得到,带噪语音基于无噪语音得到;将带噪语音信号输入至预构建语音增强网络中获取第一语音信号,对无噪语音信号进行处理得到语音特征信息;基于语音特征信息和第一语音信号获取损失函数;利用损失函数对语音增强网络进行参数调整,以完成对语音增强网络的训练。通过上述方式,本申请能够提高语音增强网络的性能,改善语音增强的效果。
-
公开(公告)号:CN118351863A
公开(公告)日:2024-07-16
申请号:CN202410302892.4
申请日:2024-03-15
申请人: 浙江大华技术股份有限公司
摘要: 本申请提出一种基于语音增强的模型训练方法、语音增强方法、语音增强装置以及计算机存储介质。所述模型训练方法包括:将训练数据集输入待训练的语音增强网络中的第一子网络,获取第一子网络的第一估计值;获取训练数据集在第一子网络的第一目标值;将第一估计值输入第二子网络,获取第二子网络的第二估计值;获取训练数据集在第二子网络的第二目标值;基于第一估计值和第一目标值获取第一代价值,基于第二估计值和第二目标值获取第二代价值;利用第一代价值和第二代价值对语音增强网络进行训练。通过上述语音增强方法,将语音增强网络分为多个阶段的子网络,每个子网络的输出均有对应的目标进行约束,从而提高网络训练效果。
-
公开(公告)号:CN118197332A
公开(公告)日:2024-06-14
申请号:CN202410301852.8
申请日:2024-03-15
申请人: 浙江大华技术股份有限公司
摘要: 本申请提出一种基于语音增强的模型训练方法、语音增强方法、语音增强装置以及计算机存储介质。所述模型训练方法包括:将所述训练数据集输入待训练的语音增强网络,获取所述第一子网络的第一代价值,以及所述第二子网络的第二代价值;获取所述第一代价值的第一代价梯度,以及获取所述第二代价值的第二代价梯度;基于所述第一代价梯度和所述第二代价梯度的梯度校正结果,获取所述语音增强网络的代价梯度;按照所述代价梯度计算所述第一代价值和所述第二代价值的总代价值;利用所述总代价值对所述语音增强网络进行训练。通过上述语音增强方法,在代价函数上设计了基于梯度校正的代价函数策略,提高网络训练效果和加快网络训练收敛速度。
-
公开(公告)号:CN116110418A
公开(公告)日:2023-05-12
申请号:CN202211625879.X
申请日:2022-12-16
申请人: 浙江大华技术股份有限公司
IPC分类号: G10L21/0208 , G10L21/0216 , G10L21/0232 , G10L21/0264 , G10L25/30 , G06N3/04 , G06N3/08
摘要: 本发明实施例提供了一种音频降噪方法和装置、存储介质及电子装置,该方法包括:获取当前时刻的第一带噪音频数据和历史时刻的第二带噪音频数据;依据所述第一带噪音频数据和所述第二带噪音频数据进行特征提取,得到目标特征信息;将所述目标特征信息输入到目标神经网络结构中,得到所述第一带噪音频数据对应的目标音频信号。通过本发明,解决了相关技术中通过纯净音频信号对降噪模型进行训练,导致降噪模型的降噪的准确度比较低的问题。
-
-
-
-
-
-
-
-
-