识别音频场景的电子设备和方法
    2.
    发明公开

    公开(公告)号:CN113016189A

    公开(公告)日:2021-06-22

    申请号:CN201980075358.1

    申请日:2019-11-15

    摘要: 提供了一种识别音频场景的电子设备和方法。识别音频场景的方法包括:根据预定的标准,将输入音频信号分离为声道;根据每个分离的声道,通过使用被训练为识别音频场景的多个神经网络,从输入音频信号中识别至少一个音频场景;以及基于对至少一个音频场景的识别的结果,通过使用被训练为结合各个声道的音频场景识别结果的神经网络,确定音频内容中包括的至少一个音频场景,其中,多个神经网络包括:第一神经网络,被训练为基于音频信号的时频形状来识别音频场景;第二神经网络,被训练为基于音频信号的频谱包络的形状来识别音频场景;以及第三神经网络,被训练为基于从音频信号中提取的特征向量来识别音频场景。

    识别音频场景的电子设备和方法

    公开(公告)号:CN113016189B

    公开(公告)日:2023-12-19

    申请号:CN201980075358.1

    申请日:2019-11-15

    摘要: 提供了一种识别音频场景的电子设备和方法。识别音频场景的方法包括:根据预定的标准,将输入音频信号分离为声道;根据每个分离的声道,通过使用被训练为识别音频场景的多个神经网络,从输入音频信号中识别至少一个音频场景;以及基于对至少一个音频场景的识别的结果,通过使用被训练为结合各个声道的音频场景识别结果的神经网络,确定音频内容中包括的至少一个音频场景,其中,多个神经网络包括:第一神经网络,被训练为基于音频信号的时频形状来识别音频场景;第二神经网络,被训练为基于音频信号的频谱包络的形状来识别音频场景;以及第三神经网络,被训练为基于从音频信号中提取(56)对比文件US 9153231 B1,2015.10.06WO 2016148825 A1,2016.09.22CN 105720939 A,2016.06.29WO 2018162803 A1,2018.09.13US 2015120291 A1,2015.04.30CN 106469552 A,2017.03.01US 2017061966 A1,2017.03.02KR 20170124854 A,2017.11.13US 2018063662 A1,2018.03.01Yoonchang Han等.CONVOLUTIONAL NEURALNETWORKS WITH BINAURAL REPRESENTATIONSAND BACKGROUND SUBTRACTION FOR ACOUSTICSCENE CLASSIFICATION《.DETECTION ANDCLASSIFICATION OR ACOUSTIC SCENES ANDEVENTS 2017》.2017,Sharath Adavanne.SOUND EVENTDETECTION IN MULTICHANNEL AUDIO USINGSPATIAL AND HARMONIC FEATURES《.DETECTIONAND CLASSIFICATION OR ACOUSTIC SCENES ANDEVENTS 2016》.2016,Weiping Zheng等.CNNs-based AcousticScene Classification using Multi-Spectrogram Fusion and Label Expansions.《JOURNAL OF LATEX CLASS FILES》.2015,