-
公开(公告)号:CN104885153A
公开(公告)日:2015-09-02
申请号:CN201380067507.2
申请日:2013-12-19
申请人: 三星电子株式会社 , 首尔大学校产学协力团
CPC分类号: G10L21/013 , G10H1/366 , G10H2210/051 , G10H2210/066 , G10H2210/385 , G10H2250/031 , G10H2250/631 , G10L25/90
摘要: 提供了一种音频校正设备及其音频校正方法。所述音频校正方法包括:接收音频数据的输入;通过分析音频数据的谐波分量来检测起音信息;基于检测到的起音信息来检测音频数据的音高信息;基于检测到的起音信息和音高信息将音频数据与参考音频数据进行比较并将音频数据与参考音频数据对齐;将与参考音频数据对齐的音频数据校正为与参考音频数据匹配。
-
公开(公告)号:CN113016189A
公开(公告)日:2021-06-22
申请号:CN201980075358.1
申请日:2019-11-15
申请人: 三星电子株式会社
IPC分类号: H04N21/439 , H04N21/466 , G06N3/04 , G06N3/08
摘要: 提供了一种识别音频场景的电子设备和方法。识别音频场景的方法包括:根据预定的标准,将输入音频信号分离为声道;根据每个分离的声道,通过使用被训练为识别音频场景的多个神经网络,从输入音频信号中识别至少一个音频场景;以及基于对至少一个音频场景的识别的结果,通过使用被训练为结合各个声道的音频场景识别结果的神经网络,确定音频内容中包括的至少一个音频场景,其中,多个神经网络包括:第一神经网络,被训练为基于音频信号的时频形状来识别音频场景;第二神经网络,被训练为基于音频信号的频谱包络的形状来识别音频场景;以及第三神经网络,被训练为基于从音频信号中提取的特征向量来识别音频场景。
-
公开(公告)号:CN113016189B
公开(公告)日:2023-12-19
申请号:CN201980075358.1
申请日:2019-11-15
申请人: 三星电子株式会社
IPC分类号: H04N21/439 , H04N21/466 , G06N3/045 , G06N3/084 , G06N3/09 , G06N3/092 , G06N3/091
摘要: 提供了一种识别音频场景的电子设备和方法。识别音频场景的方法包括:根据预定的标准,将输入音频信号分离为声道;根据每个分离的声道,通过使用被训练为识别音频场景的多个神经网络,从输入音频信号中识别至少一个音频场景;以及基于对至少一个音频场景的识别的结果,通过使用被训练为结合各个声道的音频场景识别结果的神经网络,确定音频内容中包括的至少一个音频场景,其中,多个神经网络包括:第一神经网络,被训练为基于音频信号的时频形状来识别音频场景;第二神经网络,被训练为基于音频信号的频谱包络的形状来识别音频场景;以及第三神经网络,被训练为基于从音频信号中提取(56)对比文件US 9153231 B1,2015.10.06WO 2016148825 A1,2016.09.22CN 105720939 A,2016.06.29WO 2018162803 A1,2018.09.13US 2015120291 A1,2015.04.30CN 106469552 A,2017.03.01US 2017061966 A1,2017.03.02KR 20170124854 A,2017.11.13US 2018063662 A1,2018.03.01Yoonchang Han等.CONVOLUTIONAL NEURALNETWORKS WITH BINAURAL REPRESENTATIONSAND BACKGROUND SUBTRACTION FOR ACOUSTICSCENE CLASSIFICATION《.DETECTION ANDCLASSIFICATION OR ACOUSTIC SCENES ANDEVENTS 2017》.2017,Sharath Adavanne.SOUND EVENTDETECTION IN MULTICHANNEL AUDIO USINGSPATIAL AND HARMONIC FEATURES《.DETECTIONAND CLASSIFICATION OR ACOUSTIC SCENES ANDEVENTS 2016》.2016,Weiping Zheng等.CNNs-based AcousticScene Classification using Multi-Spectrogram Fusion and Label Expansions.《JOURNAL OF LATEX CLASS FILES》.2015,
-
-