-
公开(公告)号:CN114187923A
公开(公告)日:2022-03-15
申请号:CN202111611392.1
申请日:2021-12-27
申请人: 郑州大学
摘要: 本发明公开了一种基于一维注意力机制卷积神经网络音频识别方法,下载公开的音频信号数据构建原始数据集;使用python代码对原始数据集中的音频信号进行分帧处理;建立并训练一维注意力机制卷积神经网络;最后通过集成学习将多个模型集成,形成最终的音频识别模型。本发明优点在于采用了一维注意力机制卷积神经网络进行音频信号的识别,既克服了二维卷积神经网络原始数据需求大,计算量大,且会丢失部分有用信息的问题,又克服了一维卷积神经网络网络性能不佳,分类效果较差的问题。通过实验表明,本发明所述方法对公开数据集Urbansound8K上音频信号识别的准确率可达93%左右,加入集成学习可达94%。