一种基于图像识别的语音混响强度估计方法、装置及存储介质
摘要:
本发明公开了一种基于图像识别的语音混响强度估计方法、装置及存储介质,其通过将混响语音转换为三维语谱图;通过对所述三维语谱图进行图像检测,得到所述混响语音在所述三维语谱图中的拖尾段;计算所述拖尾段的能量强度,并以该能量强度作为混响强度的初始估计值;最后对两个以上拖尾段的初始估计值之间进行平滑处理,得到最终估计值,并将该最终估计值作为所述混响语音的混响强度的度量,从而能够极大的提高混响强度度量的抗干扰性和准确性。
0/0