基于全卷积网络的声音事件检测方法

发明授权

CN111986699B 基于全卷积网络的声音事件检测方法有权

请登陆查看更多内容

专利标题： 基于全卷积网络的声音事件检测方法
申请号： CN202010824598.1

申请日： 2020-08-17
公开(公告)号： CN111986699B

公开(公告)日： 2023-07-04
发明人: 赵光辉 , 张雨萌 , 王迎斌 , 石光明
申请人： 西安电子科技大学
申请人地址： 陕西省西安市太白南路2号
专利权人： 西安电子科技大学
当前专利权人： 西安电子科技大学
当前专利权人地址： 陕西省西安市太白南路2号
代理机构： 陕西电子工业专利中心
代理商 王品华
主分类号： G10L25/51
IPC分类号： G10L25/51 ; G10L25/18 ; G10L25/24 ; G10L25/30 ; G06F18/24 ; G06N3/0464 ; G06N3/048 ; G06N3/08

摘要：

本发明公开了一种基于全卷积神经网络的声音事件检测方法，主要解决现有网络存在的多音频事件检测精度低，时间复杂度高的问题。其实现方案是：1)对音频流进行梅尔倒谱特征提取得到音频流的时频特征图，并用这些时频特征图构成训练数据集；2)搭建一个自上而下由频率卷积网络、时间卷积网络和解码卷积网络组成的全卷积多音频事件检测网络；3)利用数据集对该全卷积多音频事件检测网络进行训练；4)将待检测音频流输入到训练好的全卷积多音频事件检测网络进行多音频事件检测，得到音频事件的类别和存在的起止时间。仿真结果表明，本发明比现有精度最高的网络3D‑CRNN，其精度提升了2％，运行速度提升了5倍左右，可用于安全监控。

公开/授权文献

CN111986699A 基于全卷积网络的声音事件检测方法公开/授权日：2020-11-24

信息查询

中国专利公布公告 Global Dossier Espacenet

IPC分类:

G	物理
G10	乐器；声学
G10L	语音分析或合成；语音识别；语音或声音处理；语音或音频编码或解码
G10L25/00	不限于组G10L 15/00-G10L 21/00的语言或者声音分析技术(当利用语音检测器来感知一些信号特殊特征的基于半导体的静噪放大器，如无信号时的感知入H03G3/34)
G10L25/48	.专门适用于特定用途
G10L25/51	..比较或判别