音频信号的上混音
    21.
    发明授权

    公开(公告)号:CN105992120B

    公开(公告)日:2019-12-31

    申请号:CN201510066647.9

    申请日:2015-02-09

    IPC分类号: H04S7/00

    摘要: 本发明的实施例涉及音频信号的上混音。描述了一种对音频信号进行上混音的方法。该方法包括:将所述音频信号分解成扩散信号和直达信号;至少部分地基于扩散信号,生成音频静态环境声,音频静态环境声包括高度声道;从直达信号中提取音频对象;估计音频对象的元数据,元数据包括音频对象的高度信息;以及将音频静态环境声和音频对象呈现为经过上混音的音频信号,其中音频静态环境声被呈现到预定义的位置并且音频对象根据元数据而被呈现。还公开了相应的系统和计算机程序产品。

    用于音频分类和处理的装置和方法

    公开(公告)号:CN109616142A

    公开(公告)日:2019-04-12

    申请号:CN201910010064.2

    申请日:2014-03-25

    IPC分类号: G10L25/81 G10L21/02 G10L17/06

    摘要: 本公开涉及用于音频分类和处理的装置和方法。在一个实施例中,音频处理装置包括:音频分类器,用于实时地将音频信号分类为至少一种音频类型;音频改进设备,用于改进听众的体验;以及调整单元,用于基于所述至少一种音频类型的置信度值以连续的方式调整音频改进设备的至少一个参数。

    具有基于迭代加权的源方向确定的音频源分离

    公开(公告)号:CN106297820A

    公开(公告)日:2017-01-04

    申请号:CN201510247108.5

    申请日:2015-05-14

    发明人: 芦烈 胡明清

    IPC分类号: G10L21/0272

    摘要: 本文中公开的示例实施例涉及利用基于迭代加权的成分分析确定的源方向的音频源分离。公开了一种分离音频内容中的音频源的方法。该音频内容包括多个声道。该方法包括从音频内容的多个时频块中获得多个数据样本。该方法还包括在多次迭代中分析数据样本以生成多个成分,其中这些成分中的每个成分指示具有数据样本的方差的方向,并且其中在多次迭代的每次迭代中,利用权值来加权数据样本中的每个数据样本,权值基于多个成分中所选择的成分。该方法进一步包括基于所选择的成分来确定音频内容的源方向,以供从音频内容中分离音频源。还公开了相应的分离音频内容中的音频源的系统和计算机程序产品。

    测量相似度的方法和设备
    25.
    发明公开

    公开(公告)号:CN105355214A

    公开(公告)日:2016-02-24

    申请号:CN201510836761.5

    申请日:2011-08-19

    发明人: 芦烈 胡明清

    IPC分类号: G10L25/51

    摘要: 描述了测量相似度的方法和设备。一种测量两个音频分段之间的内容相似度的方法,包括:从所述音频分段中提取第一特征向量,其中所述第一特征向量中的每一个中的所有特征值都是非负的并被归一化,使得所述特征值的和为1;根据所述特征向量,基于狄里克雷分布生成用于计算所述内容相似度的统计模型;以及基于所生成的统计模型计算所述内容相似度。

    音频对象提取
    27.
    发明公开

    公开(公告)号:CN104683933A

    公开(公告)日:2015-06-03

    申请号:CN201310629972.2

    申请日:2013-11-29

    发明人: 胡明清 芦烈 王珺

    IPC分类号: H04S3/00

    摘要: 本发明的实施例涉及音频对象提取。公开了一种用于从音频内容中提取音频对象的方法,所述音频内容具有基于多个声道的格式,所述方法包括:至少部分地基于所述多个声道之间的频谱相似性,对所述音频内容的各帧应用音频对象提取;以及基于对所述各帧的所述音频对象提取,跨所述音频内容的帧执行音频对象合成,以生成至少一个音频对象的音轨。还公开了相应的系统和计算机程序产品。

    对音频对象进行聚类
    30.
    发明公开

    公开(公告)号:CN116965062A

    公开(公告)日:2023-10-27

    申请号:CN202280015933.0

    申请日:2022-02-15

    发明人: 杨子瑜 芦烈

    IPC分类号: H04S7/00

    摘要: 一种用于对音频对象进行聚类的方法可以涉及识别多个音频对象,其中,该多个音频对象中的每个音频对象与指示相应空间位置信息的相应元数据和相应渲染元数据相关联。该方法可以涉及将该多个音频对象中的音频对象指派到多个渲染元数据类别中的渲染元数据类别,其中,至少一个渲染元数据类别包括要保持的多个渲染元数据类型。该方法可以涉及确定多个音频对象簇到每个渲染元数据类别的分配。该方法可以涉及基于指示空间位置信息的元数据并且基于音频对象到渲染元数据类别的指派,将该多个音频对象中的音频对象渲染到经分配的多个音频对象簇。