-
公开(公告)号:CN118692474A
公开(公告)日:2024-09-24
申请号:CN202410956721.3
申请日:2020-02-10
申请人: 奥兰治
IPC分类号: G10L19/008 , G10L19/002 , G10L19/032 , G10L19/06
摘要: 本发明涉及用于压缩N个通道的音频信号的编码方法、编码设备和介质。该方法包括:基于通道并且针对当前帧,形成通道间协方差矩阵,并搜索所述协方差矩阵的特征向量以用于获得特征向量矩阵,将针对当前帧获得的所述特征向量矩阵与针对当前帧之前的帧获得的旋转矩阵进行比较,置换当前帧的特征向量矩阵的列,以确保与前一帧的旋转矩阵的一致,测试特征向量矩阵以证实它表示N维空间中的旋转,并且如果不是,则校正特征向量矩阵,直到针对当前帧获得旋转矩阵,以及在对所述N个通道的信号进行编码之前,将所述旋转矩阵应用于所述信号。该方法还包括:将所述当前帧划分为子帧,和从前一帧t‑1的矩阵到当前帧t的矩阵对要应用于连续子帧的矩阵进行插值。
-
公开(公告)号:CN118302808A
公开(公告)日:2024-07-05
申请号:CN202280078427.6
申请日:2022-10-14
申请人: 松下电器(美国)知识产权公司
IPC分类号: G10L19/002 , G10L19/038
摘要: 编码装置包括:量化电路,产生包含与向量量化的码本相关的信息的量化参数;以及控制电路,在基于可用于对目标子向量进行编码的比特数即可使用的比特数与目标子向量的所述量化参数的比特数之差的编码中,根据条件,设定可使用的比特数。
-
公开(公告)号:CN118038879A
公开(公告)日:2024-05-14
申请号:CN202211387602.8
申请日:2022-11-07
申请人: 抖音视界有限公司
IPC分类号: G10L19/002 , G10L19/22
摘要: 本公开实施例提供了一种音频数据的处理方法及装置,涉及数据处理技术领域。该方法包括:确定第一音频帧的编码模式;判断所述第一音频帧的编码模式与第二音频帧的编码模式是否相同;若不相同,且所述第一音频帧的编码模式为多描述编码,则根据第一数据、第二数据以及第一延迟,生成第三数据;若不相同,且所述第一音频帧的编码模式为单描述编码,则根据第四数据、第五数据以及第二延迟,生成第六数据;根据所述第一音频帧的编码模式对所述目标数据进行编码,以获取所述第一音频帧的编码数据。本公开实施例用于在编码模式切换的情况下,提升解码音频质量。
-
公开(公告)号:CN111933159B
公开(公告)日:2024-04-09
申请号:CN202010749863.4
申请日:2018-11-08
申请人: 弗劳恩霍夫应用研究促进协会
IPC分类号: G10L19/002 , G10L19/18 , G10L19/02 , G10L19/032
摘要: 一种用于基于经编码音频信息提供经解码音频信息的音频解码器经配置以基于表示频谱值的经编码信息获得经解码频谱值。音频解码器经配置以使用算术解码,针对一组频谱值,基于相应符号码来联合地解码每频谱值两个或更多个最高有效比特,其中相应符号码表示针对一个或多个频谱值的每频谱值两个或更多个最高有效比特。音频解码器经配置以取决于多少最低有效比特信息可用而解码与频谱值中的一个或多个相关联的一个或多个最低有效比特,使得与频谱值中的一个或多个相关联的一个或多个最低有效比特被解码,而针对解码一个或多个最高有效比特所针对的一个或多个其他频谱值,最低有效比特不被解码,一个或多个其他频谱值包括多于一个或多个最高有效比特的比特。音频解码器经配置以使用频谱值来提供经解码音频信息。音频解码器的修改是可能的。还描述了一种音频编码器。
-
-
公开(公告)号:CN117392990A
公开(公告)日:2024-01-12
申请号:CN202311306515.X
申请日:2014-01-28
申请人: 弗劳恩霍夫应用研究促进协会
发明人: 纪尧姆·福奇斯 , 克里斯蒂安·赫尔姆里希 , 曼努埃尔·扬德尔 , 本杰明·苏伯特 , 横谷嘉一
IPC分类号: G10L19/12 , G10L19/002 , G10L19/028 , G10L19/087 , G10L19/26
摘要: 本发明公开了用于码激励线性预测类编码器的无边信息的噪声填充。音频解码器包含:倾斜调整器,其被配置为使用当前帧的线性预测系数来调整噪声的倾斜以获得倾斜信息;以及噪声插入器,其被配置为根据由倾斜计算器获得的倾斜信息来将噪声添加至当前帧。根据本发明的另一音频解码器包含:噪声水平估计器,其被配置为使用至少一个先前帧的线性预测系数来估计当前帧的噪声水平以获得噪声水平信息;以及噪声插入器,其被配置为根据由噪声水平估计器提供的噪声水平信息来将噪声添加至当前帧。因此,可省略位流中的关于背景噪声的边信息。
-
公开(公告)号:CN116721667A
公开(公告)日:2023-09-08
申请号:CN202310879665.3
申请日:2017-03-17
申请人: 高通股份有限公司
发明人: V·S·阿提 , V·S·C·S·奇比亚姆 , D·J·辛德尔
IPC分类号: G10L19/002 , G10L19/025 , G10L19/008 , G10L19/22
摘要: 本发明提供一种装置,其包含处理器及发射器。所述处理器经配置以确定指示第一音频信号与第二音频信号之间的时间失配的第一量的第一失配值。所述处理器还经配置以确定指示所述第一音频信号与所述第二音频信号之间的时间失配的第二量的第二失配值。所述处理器经进一步配置以基于所述第一失配值及所述第二失配值来确定有效失配值。所述处理器还经配置以产生具有位分配的至少一个经编码信号。所述位分配至少部分地基于所述有效失配值。所述发射器经配置以将所述至少一个经编码信号发射到第二装置。
-
-
公开(公告)号:CN115701777A
公开(公告)日:2023-02-10
申请号:CN202280004249.2
申请日:2022-06-02
申请人: 腾讯美国有限责任公司
IPC分类号: G10L19/002
摘要: 本公开的各方面提供了用于音频处理的方法和装置(例如,客户端设备和服务器设备)。在一些示例中,客户端设备包括处理电路。处理电路向服务器设备传输选择信号,该选择信号指示用于对音频输入中的音频内容进行编码的音频编码配置。处理电路从服务器设备接收响应于选择信号的传输的已编码码流。已编码码流包括已根据音频编码配置被编码的音频内容。处理电路基于已编码码流渲染音频信号。
-
公开(公告)号:CN114616621A
公开(公告)日:2022-06-10
申请号:CN202080075350.8
申请日:2020-10-28
申请人: 杜比实验室特许公司
IPC分类号: G10L19/002 , G10L19/008 , G10L19/16
摘要: 公开在浸入式语音及音频服务中的位速率分布的实施例。在实施例中,一种编码IVAS位流的方法包括:接收输入音频信号;将所述输入音频信号降混成一或多个降混声道及空间元数据;从位速率分布控制表读取所述降混声道的一组一或多个位速率及所述空间元数据的一组量化水平;确定所述降混声道的所述一或多个位速率的组合;使用位速率分布过程,从所述一组元数据量化水平确定元数据量化水平;使用所述元数据量化水平来量化且编码所述空间元数据;使用一或多个位速率的所述组合来产生所述一或多个降混声道的降混位流;将所述降混位流、所述经量化且经编码空间元数据及所述一组量化水平组合成所述IVAS位流。
-
-
-
-
-
-
-
-
-