基于呈现器意识感知差异的音频对象聚集

    公开(公告)号:CN109479178A

    公开(公告)日:2019-03-15

    申请号:CN201780044709.3

    申请日:2017-07-13

    IPC分类号: H04S7/00

    摘要: 本文中揭示的实例实施例涉及基于呈现器意识感知差异的音频对象聚集。提供一种处理音频对象的方法。所述方法包含获得指示呈现器配置的呈现器相关信息。所述方法也包含基于所述获得的呈现器相关信息确定所述音频对象中的第一音频对象与第二音频对象之间相对于所述呈现器的呈现差异。所述方法进一步包含至少部分基于所述呈现差异而聚集所述音频对象。也揭示对应系统、装置和计算机程序产品。

    基于目标响度的响度归一化方法和设备

    公开(公告)号:CN107093991A

    公开(公告)日:2017-08-25

    申请号:CN201710146391.1

    申请日:2013-03-26

    IPC分类号: H03G3/30 H03G7/00

    摘要: 公开了基于目标响度的响度归一化方法和设备。在一个实施方式中,基于目标响度的响度归一化方法包括:基于内容类型或上下文来确定一个或更多个动态增益参数;以及通过采用所选择的增益参数来修改音频信号的响度,其中,回放的音频记录的所产生的响度水平基于目标响度值在时间轴上一致。

    元数据保留的音频对象聚类

    公开(公告)号:CN105895086A

    公开(公告)日:2016-08-24

    申请号:CN201410765578.6

    申请日:2014-12-11

    IPC分类号: G10L15/07 G10L15/04 G10L25/27

    摘要: 本发明的实施例涉及音频对象聚类。公开了一种用于元数据保留的音频对象聚类的方法。该方法包括基于与多个音频对象相关联的元数据中的待保留信息,将多个音频对象分类到多个类别中。该方法还包括将预定数目的簇指派给类别,以及根据指派来将这些类别中的每个类别中的音频对象分配到簇中的至少一个簇。还公开了相应的系统和计算机程序产品。

    音频分类方法和系统
    58.
    发明公开

    公开(公告)号:CN102982804A

    公开(公告)日:2013-03-20

    申请号:CN201110269279.X

    申请日:2011-09-02

    发明人: 程斌 芦烈

    IPC分类号: G10L15/08 G10L15/02

    CPC分类号: G10L25/81 G10L19/20 G10L25/51

    摘要: 描述了用于音频分类的实施例。音频分类系统包含对音频信号执行音频分类的过程的至少一个装置。该至少一个装置能够在需要不同资源的至少两个模式下工作。音频分类系统也包含复杂度控制器,其确定组合并且指示该至少一个装置根据该组合来工作。对于该至少一个装置中的每个,该组合指定该装置的模式之一,而该组合的资源要求不超过最大可用资源。通过控制模式,音频分类系统改善了针对运行环境的可伸缩性。

    采用两级噪声分类器的音量调节单元的控制

    公开(公告)号:CN118871988A

    公开(公告)日:2024-10-29

    申请号:CN202380026864.8

    申请日:2023-02-06

    摘要: 使用音量调节控制信号对音频信号进行音量调节。该方法包括:确定噪声可靠性比率w(n)作为当前时间段中似噪声帧与所有帧的比率;确定PGC噪声置信度分数XPGN(n),该分数指示在该时间段内存在专业生成内容PGC噪声的可能性;以及对于该时间段,确定噪声可靠性比率是否高于预定阈值。当噪声可靠性比率高于预定阈值时,基于PGC噪声置信度分数更新音量调节控制信号,当噪声可靠性比率低于预定阈值时,音量调节控制信号保持不变。通过防止增强例如UGC中的手机录制的环境噪声,同时对于其他类型内容保持原始行为,来改善音量调节。

    检测用户生成内容中的环境噪声
    60.
    发明公开

    公开(公告)号:CN117859176A

    公开(公告)日:2024-04-09

    申请号:CN202280057779.3

    申请日:2022-08-23

    IPC分类号: G10L21/0216 G10L21/0264

    摘要: 一种音频处理方法包括使用第一模型将音频信号分类为噪声或非噪声。对于噪声信号,使用第二模型将音频信号分类为用户生成内容(UGC)噪声或专业生成内容(PGC)噪声。对于非噪声信号或PGC噪声,使用第一音频处理过程来处理音频信号。对于UGC噪声,使用第二音频处理过程来处理音频信号。