元数据保留的音频对象聚类

    公开(公告)号:CN105895086A

    公开(公告)日:2016-08-24

    申请号:CN201410765578.6

    申请日:2014-12-11

    IPC分类号: G10L15/07 G10L15/04 G10L25/27

    摘要: 本发明的实施例涉及音频对象聚类。公开了一种用于元数据保留的音频对象聚类的方法。该方法包括基于与多个音频对象相关联的元数据中的待保留信息,将多个音频对象分类到多个类别中。该方法还包括将预定数目的簇指派给类别,以及根据指派来将这些类别中的每个类别中的音频对象分配到簇中的至少一个簇。还公开了相应的系统和计算机程序产品。

    元数据保留的音频对象聚类

    公开(公告)号:CN105895086B

    公开(公告)日:2021-01-12

    申请号:CN201410765578.6

    申请日:2014-12-11

    IPC分类号: G10L15/07 G10L15/04 G10L25/27

    摘要: 本发明的实施例涉及音频对象聚类。公开了一种用于元数据保留的音频对象聚类的方法。该方法包括基于与多个音频对象相关联的元数据中的待保留信息,将多个音频对象分类到多个类别中。该方法还包括将预定数目的簇指派给类别,以及根据指派来将这些类别中的每个类别中的音频对象分配到簇中的至少一个簇。还公开了相应的系统和计算机程序产品。

    处理基于对象的音频信号

    公开(公告)号:CN106385660A

    公开(公告)日:2017-02-08

    申请号:CN201510484949.8

    申请日:2015-08-07

    IPC分类号: H04S3/00 G10L19/008

    摘要: 本文公开的示例实施例涉及音频信号处理。音频信号具有多个音频对象。公开了一种处理音频信号的方法。该方法包括获取针对每个音频对象的对象位置;以及基于对象位置、多个对象至簇增益以及度量标准的集合,确定用于将音频对象分组成簇的簇位置。度量标准指示簇位置的质量以及对象至簇增益的质量,簇位置中的每个簇位置是簇的相应的一个簇的质心,并且对象至簇增益中的一个增益定义相应的音频对象在一个簇中的比率。该方法还包括基于对象位置、簇位置和度量标准的集合,确定对象至簇增益;以及基于所确定的簇位置和对象至簇增益,生成簇信号。还公开了相应的系统和计算机程序产品。

    视频内容协助的音频对象提取

    公开(公告)号:CN105989845A

    公开(公告)日:2016-10-05

    申请号:CN201510087313.X

    申请日:2015-02-25

    IPC分类号: G10L19/008 G10L25/57 H04S7/00

    摘要: 本发明的实施例涉及视频内容协助的音频对象提取。公开了一种从基于声道的音频内容中提取音频对象的方法。该方法包括从与基于声道的音频内容相关联的视频内容中提取至少一个视频对象,并且确定与至少一个视频对象有关的信息。该方法进一步包括基于所确定的信息,从基于声道的音频内容中提取音频对象,该音频对象要被呈现为上混音音频信号。还公开了相应的系统和计算机程序产品。

    利用子带对象概率估计的音频对象提取

    公开(公告)号:CN105336335A

    公开(公告)日:2016-02-17

    申请号:CN201410372867.X

    申请日:2014-07-25

    发明人: 陈连武 芦烈

    IPC分类号: G10L19/02 H04S3/00

    摘要: 本发明的实施例涉及音频对象提取。公开了一种用于从音频内容中提取音频对象的方法。该方法包括为所述音频内容的帧中的子带音频信号确定子带对象概率,所述子带对象概率指示所述子带音频信号包含音频对象的概率。该方法进一步包括基于确定的子带对象概率,将所述子带音频信号分割为音频对象部分和残余音频部分。还公开了相应的系统和计算机程序产品。

    元数据保留的音频对象聚类

    公开(公告)号:CN112954580B

    公开(公告)日:2022-06-28

    申请号:CN202011623482.8

    申请日:2014-12-11

    IPC分类号: H04S7/00 H04S3/00

    摘要: 本发明的实施例涉及元数据保留的音频对象聚类。公开了一种用于元数据保留的音频对象聚类的方法。该方法包括基于与多个音频对象相关联的元数据中的待保留信息,将多个音频对象分类到多个类别中。该方法还包括将预定数目的簇指派给类别,以及根据指派来将这些类别中的每个类别中的音频对象分配到簇中的至少一个簇。还公开了相应的系统和计算机程序产品。

    音频信号的上混音
    7.
    发明授权

    公开(公告)号:CN105992120B

    公开(公告)日:2019-12-31

    申请号:CN201510066647.9

    申请日:2015-02-09

    IPC分类号: H04S7/00

    摘要: 本发明的实施例涉及音频信号的上混音。描述了一种对音频信号进行上混音的方法。该方法包括:将所述音频信号分解成扩散信号和直达信号;至少部分地基于扩散信号,生成音频静态环境声,音频静态环境声包括高度声道;从直达信号中提取音频对象;估计音频对象的元数据,元数据包括音频对象的高度信息;以及将音频静态环境声和音频对象呈现为经过上混音的音频信号,其中音频静态环境声被呈现到预定义的位置并且音频对象根据元数据而被呈现。还公开了相应的系统和计算机程序产品。

    元数据保留的音频对象聚类
    8.
    发明公开

    公开(公告)号:CN112802496A

    公开(公告)日:2021-05-14

    申请号:CN202011619810.7

    申请日:2014-12-11

    IPC分类号: G10L25/51 G10L25/27

    摘要: 本发明的实施例涉及元数据保留的音频对象聚类。公开了一种用于元数据保留的音频对象聚类的方法。该方法包括基于与多个音频对象相关联的元数据中的待保留信息,将多个音频对象分类到多个类别中。该方法还包括将预定数目的簇指派给类别,以及根据指派来将这些类别中的每个类别中的音频对象分配到簇中的至少一个簇。还公开了相应的系统和计算机程序产品。

    视频内容协助的音频对象提取

    公开(公告)号:CN105989845B

    公开(公告)日:2020-12-08

    申请号:CN201510087313.X

    申请日:2015-02-25

    IPC分类号: G10L19/008 G10L25/57 H04S7/00

    摘要: 本发明的实施例涉及视频内容协助的音频对象提取。公开了一种从基于声道的音频内容中提取音频对象的方法。该方法包括从与基于声道的音频内容相关联的视频内容中提取至少一个视频对象,并且确定与至少一个视频对象有关的信息。该方法进一步包括基于所确定的信息,从基于声道的音频内容中提取音频对象,该音频对象要被呈现为上混音音频信号。还公开了相应的系统和计算机程序产品。

    处理基于对象的音频信号
    10.
    发明授权

    公开(公告)号:CN106385660B

    公开(公告)日:2020-10-16

    申请号:CN201510484949.8

    申请日:2015-08-07

    IPC分类号: H04S3/00 G10L19/008

    摘要: 本文公开的示例实施例涉及音频信号处理。音频信号具有多个音频对象。公开了一种处理音频信号的方法。该方法包括获取针对每个音频对象的对象位置;以及基于对象位置、多个对象至簇增益以及度量标准的集合,确定用于将音频对象分组成簇的簇位置。度量标准指示簇位置的质量以及对象至簇增益的质量,簇位置中的每个簇位置是簇的相应的一个簇的质心,并且对象至簇增益中的一个增益定义相应的音频对象在一个簇中的比率。该方法还包括基于对象位置、簇位置和度量标准的集合,确定对象至簇增益;以及基于所确定的簇位置和对象至簇增益,生成簇信号。还公开了相应的系统和计算机程序产品。