- 专利标题: 一种基于局部纹理特征的音频场景识别方法及系统
-
申请号: CN201811559040.4申请日: 2018-12-19
-
公开(公告)号: CN111341319B公开(公告)日: 2023-05-16
- 发明人: 白海钏 , 葛凤培 , 张鹏远 , 高圣翔 , 黄远 , 沈亮 , 林格平
- 申请人: 中国科学院声学研究所 , 国家计算机网络与信息安全管理中心
- 申请人地址: 北京市海淀区北四环西路21号;
- 专利权人: 中国科学院声学研究所,国家计算机网络与信息安全管理中心
- 当前专利权人: 中国科学院声学研究所,国家计算机网络与信息安全管理中心
- 当前专利权人地址: 北京市海淀区北四环西路21号;
- 代理机构: 北京方安思达知识产权代理有限公司
- 代理商 陈琳琳; 杨青
- 主分类号: G10L17/02
- IPC分类号: G10L17/02 ; G10L17/04 ; G10L17/18 ; G10L25/18 ; G10L25/30 ; G10L25/45 ; G10L25/51 ; G06N3/08
摘要:
本发明公开了一种基于局部纹理特征的音频场景识别方法,所述方法包括:将待识别的音频信号进行预处理后逐帧提取Mel‑fbank特征和描述局部纹理的LTP特征;进行融合后输入预先训练得到的时延深度神经网络模型;得到对应于不同音频场景类型的后验概率;采用后处理决策机制处理后验概率获取待识别音频信号对应的音频场景标签。本发明的音频场景识别方法,基于对场景时频信息的有效表征,更好地实现了音频场景种类的识别。
公开/授权文献
- CN111341319A 一种基于局部纹理特征的音频场景识别方法及系统 公开/授权日:2020-06-26