- 专利标题: 一种音频类别的确定方法、装置、电子设备及存储介质
-
申请号: CN202311182243.7申请日: 2023-09-14
-
公开(公告)号: CN116935889B公开(公告)日: 2023-11-24
- 发明人: 张德俊 , 王秋明
- 申请人: 北京远鉴信息技术有限公司
- 申请人地址: 北京市海淀区西四环北路119号A座3层320室
- 专利权人: 北京远鉴信息技术有限公司
- 当前专利权人: 北京远鉴信息技术有限公司
- 当前专利权人地址: 北京市海淀区西四环北路119号A座3层320室
- 代理机构: 北京超凡宏宇知识产权代理有限公司
- 代理商 刘凤
- 主分类号: G10L25/30
- IPC分类号: G10L25/30 ; G10L21/10 ; G10L25/03 ; G10L25/51
摘要:
本申请提供了一种音频类别的确定方法、装置、电子设备及存储介质,确定方法包括:对待检测音频进行处理,对傅里叶变换处理后的待检测音频进行音频特征提取;将音频特征输入至音频类别检测模型的扩散网络层之中,确定出待检测音频的音频特征相对应的视频特征;将视频特征以及音频特征输入至分类网络层之中,对视频特征以及音频特征进行特征融合,并确定出融合后的特征,并对融合后的特征进行分类,输出待检测音频的音频类别信息。通过利用扩散网络层确定出音频特征相对应的视频特征,将音频特征以及视频特征进行融合,利用融合后的特征进行音频类别分类,确定出待检测音频的音频类别信息,从而提高了音频类别确定的准确性。
公开/授权文献
- CN116935889A 一种音频类别的确定方法、装置、电子设备及存储介质 公开/授权日:2023-10-24