发明公开
- 专利标题: 一种基于融合通道注意力机制的残差模块的声音事件定位与识别方法
-
申请号: CN202310245365.X申请日: 2023-03-14
-
公开(公告)号: CN116631386A公开(公告)日: 2023-08-22
- 发明人: 刘一欣 , 王玫 , 杨松铭
- 申请人: 桂林理工大学
- 申请人地址: 广西壮族自治区桂林市七星区建干路12号
- 专利权人: 桂林理工大学
- 当前专利权人: 桂林理工大学
- 当前专利权人地址: 广西壮族自治区桂林市七星区建干路12号
- 主分类号: G10L15/16
- IPC分类号: G10L15/16 ; G10L25/18 ; G10L25/78 ; G10L15/06
摘要:
本发明提供一种基于融合通道注意力机制的残差模块的声音事件定位与识别方法,该方法采用了SE残差块对网络的特征提取能力和空间信息的融合进行了改进,同时可以实现同时进行声音事件检测和声音事件定位,减少了算法复杂度和计算量,使用联合训练的方法优化了声音事件检测和声音事件定位任务的损失函数,提高了模型的泛化能力和稳定性。