高频音频重建技术的集成
    2.
    发明公开

    公开(公告)号:CN118782078A

    公开(公告)日:2024-10-15

    申请号:CN202411156478.3

    申请日:2019-04-25

    摘要: 本公开涉及高频音频重建技术的集成。本发明揭示一种用于解码经编码音频位流的方法。所述方法包含接收所述经编码音频位流且解码音频数据以产生经解码低频带音频信号。所述方法进一步包含提取高频重建元数据且使用分析滤波器组来对所述经解码低频带音频信号滤波以产生经滤波低频带音频信号。所述方法还包含提取指示是对所述音频数据执行频谱平移还是谐波转置的标记且根据所述标记使用所述经滤波低频带音频信号及所述高频重建元数据来再生所述音频信号的高频带部分。将所述高频再生执行为每个音频频道具有3010个样本的延迟的后处理操作。

    动态EQ
    3.
    发明授权
    动态EQ 有权

    公开(公告)号:CN112384976B

    公开(公告)日:2024-10-11

    申请号:CN201980046361.0

    申请日:2019-07-11

    IPC分类号: G10L21/02 H04S7/00

    摘要: 公开了用于(可能同时)将EQ和DRC应用于音频信号的各种实施例。在实施例中,一种方法包括:将输入音频信号划分为n个帧,其中,n为大于1的正整数;将所述输入音频信号的每一帧划分为Nb个频带,其中,Nb为大于1的正整数;对于每一帧n:计算每个频带f中所述输入音频信号的输入电平,得到所述输入音频信号的输入音频电平分布;至少部分地基于所述输入音频电平分布的一个或多个属性到从一个或多个参考音频信号计算出的参考音频电平分布的映射针对每个频带f计算增益;以及将每个频带f的每个计算出的增益应用于所述输入音频信号的每个对应频带f。

    用于控制对经低比特率编码的音频的增强的方法和装置

    公开(公告)号:CN112639968B

    公开(公告)日:2024-10-01

    申请号:CN201980055735.5

    申请日:2019-08-29

    IPC分类号: G10L19/24 G10L21/02 G10L25/30

    摘要: 描述了一种用于对音频数据进行低比特率编码并生成用于在解码器侧控制对所述经低比特率编码的音频数据的音频增强的增强元数据的方法,所述方法包括以下步骤:(a)以低比特率对原始音频数据进行核心编码以获得经编码的音频数据;(b)生成要用于在对所述经编码的音频数据进行核心解码之后在所述解码器侧控制音频增强的类型和/或量的增强元数据;以及(c)输出所述经编码的音频数据和所述增强元数据。进一步描述了被配置为执行所述方法的编码器。此外,描述了一种用于基于增强元数据从经低比特率编码的音频数据生成增强的音频数据的方法以及一种被配置为执行所述方法的解码器。

    用于产生或解码包括沉浸式音频信号的位流的方法及装置

    公开(公告)号:CN118711601A

    公开(公告)日:2024-09-27

    申请号:CN202410978891.1

    申请日:2019-07-02

    摘要: 本公开涉及用于产生或解码包括沉浸式音频信号的位流的方法及装置。本文档描述一种用于产生位流(101)的方法(500),其中所述位流(101)包括用于沉浸式音频信号(111)的帧序列的超帧(400)序列。所述方法(500)包括针对所述超帧(400)序列重复地将从所述沉浸式音频信号(111)导出的一或多个降混声道信号(203)的一或多个帧的经编码音频数据(206)插入(501)到超帧(400)的数据字段(411、421、412、422)中;及将用于从所述经编码音频数据(206)重构所述沉浸式音频信号(111)的一或多个帧的元数据(202、205)插入(502)到所述超帧(400)的元数据字段(403)中。

    高频音频重建技术的集成

    公开(公告)号:CN112189231B

    公开(公告)日:2024-09-20

    申请号:CN201980034785.5

    申请日:2019-04-25

    摘要: 本发明揭示一种用于解码经编码音频位流的方法。所述方法包含接收所述经编码音频位流且解码音频数据以产生经解码低频带音频信号。所述方法进一步包含提取高频重建元数据且使用分析滤波器组来对所述经解码低频带音频信号滤波以产生经滤波低频带音频信号。所述方法还包含提取指示是对所述音频数据执行频谱平移还是谐波转置的标记且根据所述标记使用所述经滤波低频带音频信号及所述高频重建元数据来再生所述音频信号的高频带部分。将所述高频再生执行为每个音频频道具有3010个样本的延迟的后处理操作。

    高效DRC配置文件传输
    7.
    发明授权

    公开(公告)号:CN113257273B

    公开(公告)日:2024-09-13

    申请号:CN202110526962.0

    申请日:2015-09-29

    摘要: 本公开涉及高效DRC配置文件传输。描述了一种用于对编码音频信号进行解码的方法。编码音频信号包括帧序列,并且指示用于对应的多个不同渲染模式的多个不同的动态范围控制(DRC)配置文件。所述方法包括:从所述多个不同的渲染模式确定第一渲染模式;从帧序列的当前帧内所包括的DRC配置文件子集确定一个或多个DRC配置文件;确定所述一个或多个DRC配置文件中的至少一个是否适用于第一渲染模式;如果所述一个或多个DRC配置文件都不适用于第一渲染模式,则选择默认DRC配置文件作为当前DRC配置文件;其中,默认DRC配置文件的定义数据在解码器处是已知的;并且使用当前DRC配置文件对当前帧进行解码。

    用于音频信号的动态范围控制和调整的方法和装置

    公开(公告)号:CN112185398B

    公开(公告)日:2024-08-30

    申请号:CN202011087991.3

    申请日:2013-05-02

    IPC分类号: G10L19/008 G10L19/18

    摘要: 本公开涉及用于维持与参数音频编码器相关联的可逆动态范围控制信息的系统。以比特流(P)为基础,通过从比特流导出m通道核心信号(Y)和多通道编码参数(α)重构n通道音频信号(X),此处1≤m<n。从比特流还导出量化核心信号的编码器侧动态范围限制的预处理动态范围控制参数,即预处理DRC参数(DRC2)。在基于预处理DRC参数消除任何编码器侧动态范围限制的同时通过根据多通道编码参数的参数合成获得n通道音频信号。在特定的实施例中,重构进一步包括量化可能的解码器侧动态范围压缩的经补偿的后处理DRC参数的使用。优选地,由不同解码器侧组件执行编码器侧范围限制消除和范围压缩。消除和压缩可以由DRC预处理器协调。

    将以不同格式捕获的音频信号转换为减少数量的格式以简化编码及解码操作

    公开(公告)号:CN118522297A

    公开(公告)日:2024-08-20

    申请号:CN202410742198.4

    申请日:2019-10-07

    IPC分类号: G10L19/008 H04S3/00

    摘要: 本公开涉及将以不同格式捕获的音频信号转换为减少数量的格式以简化编码及解码操作。所公开实施例实现将由各种捕获装置以各种格式捕获的音频信号转变成可由音频编解码器(例如,沉浸式语音及音频服务IVAS编解码器)处理的有限数量的格式。在实施例中,音频装置的简化单元接收由耦合到所述音频装置的一或多个音频捕获装置捕获的音频信号。所述简化单元确定所述音频信号是否呈所述音频装置的编码单元支持/不支持的格式。基于所述确定,所述简化单元将所述音频信号转变成所述编码单元支持的格式。在实施例中,如果所述简化单元确定所述音频信号呈空间格式,那么所述简化单元可将所述音频信号转变成所述编码支持的空间“夹层”格式。