叠音检测方法、装置、计算机设备和存储介质
摘要:
本申请涉及一种叠音检测方法、装置、计算机设备、存储介质和计算机程序产品。通过将待检测音频的音频特征输入第一二分类模型,由第一二分类模型检测待检测音频中的人声音频特征,将人声音频特征输入第二二分类模型,由第二二分类模型检测人声音频特征中的叠音音频特征,并基于叠音音频特征确定叠音音频。其中叠音音频特征表示包含至少两种人声音频的音频特征,第一二分类模型和第二二分类模型分别基于人声音频样本和由至少两种人声音频样本合成得到的音频样本训练得到。相较于传统的通过单级模型进行检测的方式,本方案通过多个由合成叠音训练的二分类模型分别检测音频中的人声音频以及人声音频中的叠音音频,提高了叠音检测的准确度。
公开/授权文献
0/0