-
公开(公告)号:CN117935836A
公开(公告)日:2024-04-26
申请号:CN202311776034.5
申请日:2023-12-21
申请人: 浙江大华技术股份有限公司
IPC分类号: G10L21/0224 , G10L21/0232 , G10L21/0208 , G10L21/0216
摘要: 本公开涉及一种回声消除方法、装置及设备,该方法包括:获取当前帧远端信号和多个近端信号;基于前一帧各通道的各滤波器子块的第一滤波器系数、远端信号和多个近端信号,得到各通道的第一残差信号;基于各通道的第一残差信号确定近端语音协方差矩阵;基于任一通道的各滤波器子块的状态协方差矩阵、远端信号和近端语音协方差矩阵,确定任一通道的各滤波器子块的目标步长;基于任一通道的各滤波器子块的目标步长确定当前帧各通道的各滤波器子块的第二滤波器系数;基于当前帧各通道的各滤波器子块的第二滤波器系数、后一帧远端信号和各通道的近端信号,确定后一帧各通道的第二残差信号。本公开能保证较好回声消除效果,降低回声消除的计算复杂度。
-
公开(公告)号:CN117935833A
公开(公告)日:2024-04-26
申请号:CN202311779394.0
申请日:2023-12-21
申请人: 浙江大华技术股份有限公司
IPC分类号: G10L21/0208 , G10L21/0264 , G10L21/0216
摘要: 本申请公开了一种语音增强方法、设备及存储介质,该语音增强方法包括:对待处理音频信号进行加性噪声抑制处理,确定待处理音频信号进行加性噪声抑制处理采用的语音估计增益系数;提取待处理音频信号对应的基音频率,根据基音频率确定平滑系数;按照平滑系数对语音估计增益系数进行平滑,得到平滑增益系数;根据平滑增益系数对待处理音频信号进行语音增强,得到目标纯净语音信号。可以在抑制加性噪声的前提下,有效抑制因为噪声抑制不准确造成的残余噪声,且根据基音频率确定的平滑系数可以避免语音失真。
-
公开(公告)号:CN117935831A
公开(公告)日:2024-04-26
申请号:CN202311777130.1
申请日:2023-12-21
申请人: 浙江大华技术股份有限公司
IPC分类号: G10L21/0208 , G10L21/0264 , G10L21/0216 , G10L25/30
摘要: 本申请公开了一种语音增强网络的训练方法、语音增强方法、电子设备及计算机可读存储介质。该方法包括获取带噪语音信号和无噪语音信号,带噪语音信号基于带噪语音得到,无噪语音信号基于无噪语音得到,带噪语音基于无噪语音得到;将带噪语音信号输入至预构建语音增强网络中获取第一语音信号,对无噪语音信号进行处理得到语音特征信息;基于语音特征信息和第一语音信号获取损失函数;利用损失函数对语音增强网络进行参数调整,以完成对语音增强网络的训练。通过上述方式,本申请能够提高语音增强网络的性能,改善语音增强的效果。
-
公开(公告)号:CN116092526A
公开(公告)日:2023-05-09
申请号:CN202310030937.2
申请日:2023-01-10
申请人: 浙江大华技术股份有限公司
摘要: 本申请实施例提供了一种信号检测方法及装置,用以提高目标信号的检测精度。本申请提供的一种信号检测方法,包括:获取待检测信号,对待检测信号进行分帧,并计算每一帧信号中目标频率信号的能量;针对每一帧信号,利用该帧信号中的目标频率信号的能量,确定该帧信号对应的能量均值;并且,利用该帧信号中的目标频率信号的能量以及该帧信号对应的能量均值,判断该帧信号中是否存在目标信号,得到该帧信号对应的判断结果;利用多帧信号对应的判断结果,最终确定待检测信号中是否存在目标信号。
-
公开(公告)号:CN118351863A
公开(公告)日:2024-07-16
申请号:CN202410302892.4
申请日:2024-03-15
申请人: 浙江大华技术股份有限公司
摘要: 本申请提出一种基于语音增强的模型训练方法、语音增强方法、语音增强装置以及计算机存储介质。所述模型训练方法包括:将训练数据集输入待训练的语音增强网络中的第一子网络,获取第一子网络的第一估计值;获取训练数据集在第一子网络的第一目标值;将第一估计值输入第二子网络,获取第二子网络的第二估计值;获取训练数据集在第二子网络的第二目标值;基于第一估计值和第一目标值获取第一代价值,基于第二估计值和第二目标值获取第二代价值;利用第一代价值和第二代价值对语音增强网络进行训练。通过上述语音增强方法,将语音增强网络分为多个阶段的子网络,每个子网络的输出均有对应的目标进行约束,从而提高网络训练效果。
-
公开(公告)号:CN118197332A
公开(公告)日:2024-06-14
申请号:CN202410301852.8
申请日:2024-03-15
申请人: 浙江大华技术股份有限公司
摘要: 本申请提出一种基于语音增强的模型训练方法、语音增强方法、语音增强装置以及计算机存储介质。所述模型训练方法包括:将所述训练数据集输入待训练的语音增强网络,获取所述第一子网络的第一代价值,以及所述第二子网络的第二代价值;获取所述第一代价值的第一代价梯度,以及获取所述第二代价值的第二代价梯度;基于所述第一代价梯度和所述第二代价梯度的梯度校正结果,获取所述语音增强网络的代价梯度;按照所述代价梯度计算所述第一代价值和所述第二代价值的总代价值;利用所述总代价值对所述语音增强网络进行训练。通过上述语音增强方法,在代价函数上设计了基于梯度校正的代价函数策略,提高网络训练效果和加快网络训练收敛速度。
-
公开(公告)号:CN116110418A
公开(公告)日:2023-05-12
申请号:CN202211625879.X
申请日:2022-12-16
申请人: 浙江大华技术股份有限公司
IPC分类号: G10L21/0208 , G10L21/0216 , G10L21/0232 , G10L21/0264 , G10L25/30 , G06N3/04 , G06N3/08
摘要: 本发明实施例提供了一种音频降噪方法和装置、存储介质及电子装置,该方法包括:获取当前时刻的第一带噪音频数据和历史时刻的第二带噪音频数据;依据所述第一带噪音频数据和所述第二带噪音频数据进行特征提取,得到目标特征信息;将所述目标特征信息输入到目标神经网络结构中,得到所述第一带噪音频数据对应的目标音频信号。通过本发明,解决了相关技术中通过纯净音频信号对降噪模型进行训练,导致降噪模型的降噪的准确度比较低的问题。
-
公开(公告)号:CN116047490A
公开(公告)日:2023-05-02
申请号:CN202211724125.X
申请日:2022-12-30
申请人: 浙江大华技术股份有限公司
IPC分类号: G01S11/14
摘要: 本申请公开了一种基于扬声器和麦克风的测距方法、装置、设备及介质,本申请中,控制扬声器发出目标频率和目标数字音频信号电平的声音信号,根据预先标定的声音信号通过散射到达麦克风所需的时长和到达所述麦克风时的能量值,对麦克风采集到的声音信号进行滤波处理,根据滤波处理后的声音信号中目标频率对应的时间确定所述扬声器与障碍物之间的距离。本申请实现了基于扬声器和麦克风进行测距的方案,降低了测距的成本,解决了因成本问题使得测距局限性较大的问题。
-
公开(公告)号:CN117935853A
公开(公告)日:2024-04-26
申请号:CN202311726562.X
申请日:2023-12-14
申请人: 浙江大华技术股份有限公司
摘要: 本申请公开了一种墙体检测方法、终端设备及存储介质,该墙体的类型检测方法包括:获取待检测音频信息,待检测音频信息为墙体拆除过程中采集得到;将待检测音频信息输入至音频判据模型,得到音频判据信息;其中,音频判据模型由样本音频数据进行特征提取得到的特征信息构建形成,样本音频数据为不同类型的墙体采用不同的拆除作业方式时分别采集得到;基于音频判据信息,确定墙体的类型。上述方案,利用不同墙体采用不同拆除作业方式采集得到的声音特征与待检测音频信息之间的关系,更准确地确定出墙体的类型。
-
公开(公告)号:CN117935832A
公开(公告)日:2024-04-26
申请号:CN202311777320.3
申请日:2023-12-21
申请人: 浙江大华技术股份有限公司
IPC分类号: G10L21/0208 , G10L21/0264 , G10L21/0216
摘要: 本申请公开了一种语音增强方法、语音增强装置以及计算机存储介质,该方法包括:获取当前帧的待增强语音;基于待增强语音上一帧的观测信号协方差矩阵的逆矩阵以及遗忘因子获取待增强语音的观测信号协方差矩阵的逆矩阵;基于待增强语音的语音信号协方差矩阵以及待增强语音上一帧的语音信号协方差矩阵中的最大特征向量得到待增强语音的语音信号协方差矩阵中的最大特征向量;基于待增强语音的观测信号协方差矩阵逆矩阵和待增强语音的语音信号协方差矩阵中的最大特征向量得到待增强语音的增强权重;使用增强权重对待增强语音进行增强。通过上述方式,无需考虑声源角度等信息就能得到待增强语音的声源特征信息,并计算增强权重实现对待增强语音的增强。
-
-
-
-
-
-
-
-
-