发明公开
CN110111773A 基于卷积神经网络的音乐信号多乐器识别方法
失效 - 权利终止
- 专利标题: 基于卷积神经网络的音乐信号多乐器识别方法
- 专利标题(英): Convolutional neural network-based music signal multi-instrument identification method
-
申请号: CN201910256905.8申请日: 2019-04-01
-
公开(公告)号: CN110111773A公开(公告)日: 2019-08-09
- 发明人: 丁泉龙 , 李荣光 , 韦岗 , 曹燕
- 申请人: 华南理工大学
- 申请人地址: 广东省广州市天河区五山路381号
- 专利权人: 华南理工大学
- 当前专利权人: 华南理工大学
- 当前专利权人地址: 广东省广州市天河区五山路381号
- 代理机构: 广州市华学知识产权代理有限公司
- 代理商 李斌
- 主分类号: G10L15/02
- IPC分类号: G10L15/02 ; G10L15/08 ; G10L15/16 ; G10L25/03 ; G10L25/30 ; G10L25/51
摘要:
本发明公开了一种基于卷积神经网络的音乐信号多乐器识别方法,包括以下步骤:S1、对输入的音频提取两种特征:音高特征矩阵和基于音色的常数Q变换矩阵;S2、先按乐器族分类,包括管、弦、打击乐,将常数Q变换矩阵输入一级卷积神经网络得到分类矩阵,然后输入分类器得到粗分类结果,即所述乐器族类别;S3、在所述分类矩阵的基础上,结合音高矩阵,输入带有注意力网络的二级卷积神经网络中,得到细分结果,即具体某种乐器。其中,所述的注意力网络对不同谐波分配权重。本发明适用于音乐信息检索中乐器识别任务,可用于音乐自动转录中的乐器识别方法。
公开/授权文献
- CN110111773B 基于卷积神经网络的音乐信号多乐器识别方法 公开/授权日:2021-03-30