用于处理多通道音频信号的装置和方法

    公开(公告)号:CN116917985A

    公开(公告)日:2023-10-20

    申请号:CN202280011393.9

    申请日:2022-01-25

    Abstract: 根据本公开的多种实施例,音频处理装置包括至少一个处理器,该处理器被配置为执行一个或多个指令以从至少一个第一音频信号获得下混的第二音频信号,获得与至少一个第一音频信号的误差消除相关的信息,从下混的第二音频信号解混至少一个第一音频信号,以及通过将与至少一个第一音频信号的误差消除相关的信息应用于从第二音频信号中解混的至少一个第一音频信号来重构至少一个第一音频信号。使用至少一个第一音频信号的原始信号功率或解码后的至少一个第一音频信号的第二信号功率中的至少一个来生成与误差消除相关的信息。

    音频编码装置和方法,以及音频解码装置和方法

    公开(公告)号:CN116324979A

    公开(公告)日:2023-06-23

    申请号:CN202180066296.5

    申请日:2021-09-24

    Abstract: 根据一个实施例,公开了一种音频信号处理装置,包括:用于存储指令的存储器;以及用于执行存储在存储器中的指令的处理器,其中:该处理器通过对包括n个声道的第一音频信号进行频率变换,在频域中生成第一音频信号,在第一DNN的基础上在频域中从第一音频信号生成特定声道的频率特征信号,在第二DNN的基础上在从第一音频信号生成包括m(m

    音频处理设备和方法
    5.
    发明公开

    公开(公告)号:CN116762128A

    公开(公告)日:2023-09-15

    申请号:CN202280011465.X

    申请日:2022-01-27

    Abstract: 一种音频处理装置可以从与包括在第一声道组中的声道相对应的第一音频信号中获得与包括在第二声道组中的声道相对应的第二音频信号,通过使用人工智能(AI)模型对与基于与第二声道组的相关性从包括在第一声道组中的声道中识别的至少一个声道相对应的至少一个第三音频信号进行下采样,并且生成包括与包括在第二声道组中的声道相对应的第二音频信号和下采样的至少一个第三音频信号的比特流。第一声道组包括原始音频信号的声道组,并且第二声道组通过组合第一声道组中包括的声道中的至少两个声道来构建。

    视频处理设备和方法
    6.
    发明公开

    公开(公告)号:CN116210233A

    公开(公告)日:2023-06-02

    申请号:CN202180066099.3

    申请日:2021-09-28

    Abstract: 公开了一种根据实施例的视频处理装置,其包括至少一个处理器,其中所述至少一个处理器配置成通过基于第一深度神经网络(DNN)分析包括多个图像的视频信号,为每个时间和频率生成多个特征信息,基于第二DNN从所述视频信号中提取对应于视频中对象的运动的第一高度分量和第一平面分量,通过使用第三DNN从不具有高度分量的第一音频信号中提取对应于所述音频中声源的运动的第二平面分量,从所述第一高度分量、所述第一平面分量和所述第二平面分量生成第二高度分量,基于所述特征信息输出包括所述第二高度分量的第二音频信号,以及使所述第二音频信号与所述视频信号同步并输出所述信号。

Patent Agency Ranking