用于音频分类和处理的装置和方法

    公开(公告)号:CN109616142B

    公开(公告)日:2023-11-07

    申请号:CN201910010064.2

    申请日:2014-03-25

    IPC分类号: G10L25/81 G10L21/02 G10L17/06

    摘要: 本公开涉及用于音频分类和处理的装置和方法。在一个实施例中,音频处理装置包括:音频分类器,用于实时地将音频信号分类为至少一种音频类型;音频改进设备,用于改进听众的体验;以及调整单元,用于基于所述至少一种音频类型的置信度值以连续的方式调整音频改进设备的至少一个参数。

    混响环境的源分离
    2.
    发明授权

    公开(公告)号:CN109644304B

    公开(公告)日:2021-07-13

    申请号:CN201780052977.X

    申请日:2017-08-28

    发明人: 王珺

    摘要: 本发明揭示混响环境的源分离的实施例。根据方法,分别通过至少两个麦克风针对其间仅至少一个源中的个别者产生声音的时段捕获针对每一所述个别者的第一麦克风信号。通过处理器基于所述第一麦克风信号学习用于对所述至少一个源与所述至少两个麦克风之间的声路建模的混合参数。分别通过所述至少两个麦克风针对其间所述至少一个源中的全部产生声音的时段捕获第二麦克风信号。通过所述处理器基于所述混合参数及第二麦克风信号估计所述重建模型。所述处理器通过应用所述重建模型而执行所述源分离。

    音频信号的上混音
    3.
    发明授权

    公开(公告)号:CN105992120B

    公开(公告)日:2019-12-31

    申请号:CN201510066647.9

    申请日:2015-02-09

    IPC分类号: H04S7/00

    摘要: 本发明的实施例涉及音频信号的上混音。描述了一种对音频信号进行上混音的方法。该方法包括:将所述音频信号分解成扩散信号和直达信号;至少部分地基于扩散信号,生成音频静态环境声,音频静态环境声包括高度声道;从直达信号中提取音频对象;估计音频对象的元数据,元数据包括音频对象的高度信息;以及将音频静态环境声和音频对象呈现为经过上混音的音频信号,其中音频静态环境声被呈现到预定义的位置并且音频对象根据元数据而被呈现。还公开了相应的系统和计算机程序产品。

    用于音频分类和处理的装置和方法

    公开(公告)号:CN109616142A

    公开(公告)日:2019-04-12

    申请号:CN201910010064.2

    申请日:2014-03-25

    IPC分类号: G10L25/81 G10L21/02 G10L17/06

    摘要: 本公开涉及用于音频分类和处理的装置和方法。在一个实施例中,音频处理装置包括:音频分类器,用于实时地将音频信号分类为至少一种音频类型;音频改进设备,用于改进听众的体验;以及调整单元,用于基于所述至少一种音频类型的置信度值以连续的方式调整音频改进设备的至少一个参数。

    音频对象提取
    6.
    发明公开

    公开(公告)号:CN104683933A

    公开(公告)日:2015-06-03

    申请号:CN201310629972.2

    申请日:2013-11-29

    发明人: 胡明清 芦烈 王珺

    IPC分类号: H04S3/00

    摘要: 本发明的实施例涉及音频对象提取。公开了一种用于从音频内容中提取音频对象的方法,所述音频内容具有基于多个声道的格式,所述方法包括:至少部分地基于所述多个声道之间的频谱相似性,对所述音频内容的各帧应用音频对象提取;以及基于对所述各帧的所述音频对象提取,跨所述音频内容的帧执行音频对象合成,以生成至少一个音频对象的音轨。还公开了相应的系统和计算机程序产品。

    均衡器控制器和控制方法以及音频再现设备

    公开(公告)号:CN104079247B

    公开(公告)日:2018-02-09

    申请号:CN201310100401.X

    申请日:2013-03-26

    IPC分类号: H03G3/20 G10L15/08 G10L15/02

    CPC分类号: H03G5/165 H03G5/005 H04R3/04

    摘要: 公开了均衡器控制器和控制方法以及音频再现设备。在一个实施方式中,均衡器控制器包括:音频分类器,用于实时地识别音频信号的音频类型;以及调整单元,用于基于所识别的音频类型的置信度值来以连续的方式调整均衡器,其中,音频分类器被配置成将音频信号分类到具有相应置信度值的多个音频类型中,并且调整单元被配置成通过基于多个音频类型的重要性对多个音频类型的置信度值进行加权来考虑多个音频类型中的至少一些音频类型。

    分解音频信号
    10.
    发明公开

    公开(公告)号:CN105336332A

    公开(公告)日:2016-02-17

    申请号:CN201410357288.8

    申请日:2014-07-17

    发明人: 王珺 芦烈

    IPC分类号: G10L19/008

    摘要: 本发明的实施例涉及信号处理。公开了分解来自至少两个不同声道的多个音频信号的方法。该方法包括获得一组成分,该组成分是弱相关的,该组成分基于该多个音频信号而生成。该方法包括从该组成分提取特征,并且至少部分地基于所提取的特征来确定与该组成分相关联的一组增益,该增益中的每个增益指示相关联的成分中的扩散部分的比例。该方法还包括通过将该组增益应用到该组成分来分解该多个音频信号。还公开了相应的系统和计算机程序产品。