- 专利标题: 一种基于多特征融合和组合模型的鸟声识别方法
-
申请号: CN202110912736.6申请日: 2021-08-10
-
公开(公告)号: CN113724712B公开(公告)日: 2023-05-30
- 发明人: 周晓彦 , 欧昀 , 李大鹏 , 刘文强
- 申请人: 南京信息工程大学
- 申请人地址: 江苏省南京市浦口区宁六路219号
- 专利权人: 南京信息工程大学
- 当前专利权人: 南京信息工程大学
- 当前专利权人地址: 江苏省南京市浦口区宁六路219号
- 代理机构: 南京经纬专利商标代理有限公司
- 代理商 徐莹
- 主分类号: G10L17/02
- IPC分类号: G10L17/02 ; G10L17/04 ; G10L17/18 ; G10L17/26 ; G10L25/24 ; G10L25/30
摘要:
本发明公开了一种基于多特征融合和组合模型的鸟声识别方法,包括:对读取的原始鸟声音频进行预处理,包括预加重和分帧加窗;提取鸟声的梅尔倒谱系数、梅尔滤波后的能量系数、短时过零率和短时频谱质心四种特征,分别归一化后进行纵向拼接形成融合特征;绘制STFT语谱图;将融合特征和绘制的STFT语谱图分别输入构建的两个基于Inception模块的CNN模型进行训练,训练完成后将两个模型输出的概率数组进行拼接形成一个特征数组,并将该特征数组作为ANN模型的输入进行训练,训练完成后加载上述三个模型的最优参数;将待测的任一鸟声音频输入加载最优参数后的三个模型,得到鸟声识别分类结果。本发明可提高不同鸟声之间特征的差异性,并且提高了鸟声识别准确率。
公开/授权文献
- CN113724712A 一种基于多特征融合和组合模型的鸟声识别方法 公开/授权日:2021-11-30