一种基于融合通道注意力机制的残差模块的声音事件定位与识别方法
摘要:
本发明提供一种基于融合通道注意力机制的残差模块的声音事件定位与识别方法,该方法采用了SE残差块对网络的特征提取能力和空间信息的融合进行了改进,同时可以实现同时进行声音事件检测和声音事件定位,减少了算法复杂度和计算量,使用联合训练的方法优化了声音事件检测和声音事件定位任务的损失函数,提高了模型的泛化能力和稳定性。
0/0