伪造语音检测模型的训练方法、伪造语音检测方法及设备
摘要:
本申请公开一种伪造语音检测模型的训练方法、伪造语音检测方法及设备,属于多媒体安全技术领域。该方法包括:获取多个音频样本文件;从多个音频样本文件的文本数据和音频数据中提取多模态样本特征,对多模态样本特征进行特征融合处理,得到各个音频样本文件对应的融合特征;使用多个音频样本文件对应的融合特征对预先构建的自蒸馏声学模型进行迭代训练,得到伪造语音检测模型。这样,能够使自蒸馏声学模型充分挖掘不同模态特征之间的相关性,提高模型的表达能力和泛化能力,从而有利于提高伪造语音检测模型对伪造语音检测的准确率。
0/0