一种基于局部纹理特征的音频场景识别方法及系统

发明授权

CN111341319B 一种基于局部纹理特征的音频场景识别方法及系统有权

请登陆查看更多内容

专利标题： 一种基于局部纹理特征的音频场景识别方法及系统
申请号： CN201811559040.4

申请日： 2018-12-19
公开(公告)号： CN111341319B

公开(公告)日： 2023-05-16
发明人: 白海钏 , 葛凤培 , 张鹏远 , 高圣翔 , 黄远 , 沈亮 , 林格平
申请人： 中国科学院声学研究所 , 国家计算机网络与信息安全管理中心
申请人地址： 北京市海淀区北四环西路21号;
专利权人： 中国科学院声学研究所,国家计算机网络与信息安全管理中心
当前专利权人： 中国科学院声学研究所,国家计算机网络与信息安全管理中心
当前专利权人地址： 北京市海淀区北四环西路21号;
代理机构： 北京方安思达知识产权代理有限公司
代理商 陈琳琳; 杨青
主分类号： G10L17/02
IPC分类号： G10L17/02 ; G10L17/04 ; G10L17/18 ; G10L25/18 ; G10L25/30 ; G10L25/45 ; G10L25/51 ; G06N3/08

摘要：

本发明公开了一种基于局部纹理特征的音频场景识别方法，所述方法包括：将待识别的音频信号进行预处理后逐帧提取Mel‑fbank特征和描述局部纹理的LTP特征；进行融合后输入预先训练得到的时延深度神经网络模型；得到对应于不同音频场景类型的后验概率；采用后处理决策机制处理后验概率获取待识别音频信号对应的音频场景标签。本发明的音频场景识别方法，基于对场景时频信息的有效表征，更好地实现了音频场景种类的识别。

公开/授权文献

CN111341319A 一种基于局部纹理特征的音频场景识别方法及系统公开/授权日：2020-06-26

信息查询

中国专利公布公告

审查信息

Global Dossier

Espacenet

IPC分类:

G	物理
G10	乐器；声学
G10L	语音分析或合成；语音识别；语音或声音处理；语音或音频编码或解码
G10L17/00	讲话者辨认或验证
G10L17/02	.预处理操作，例如：片断选择；模式表示或模拟，例如基于线性判别式分析(LDA)或主要部件；特征选择或提取