基于多粒度注意力机制的深度合成音频检测方法和装置
摘要:
本发明属于深度合成音频检测领域技术领域,特别涉及一种基于多粒度注意力机制的深度合成音频检测方法和装置,其中,深度合成音频检测方法包括以下步骤:获取待检测音频;对待检测音频进行预处理,得到对应的频谱图;对频谱图进行多粒度特征提取,得到不同时间尺度的中间特征;对不同时间尺度的中间特征采用多粒度注意力机制进行特征融合,得到多粒度特征;将多粒度特征输入预训练好的深度合成音频检测模型中,输出对应的预测结果。本发明提供的深度合成音频检测方法多粒度注意力机制,结合深度学习技术,充分利用音频信号的时频特征,提高对不同时序的关注能力,从而提高音频检测的准确性和鲁棒性。
0/0