即时播放帧(IPF)的生成、传输及处理的方法、设备及系统

    公开(公告)号:CN112740325B

    公开(公告)日:2024-04-16

    申请号:CN201980061575.5

    申请日:2019-08-20

    IPC分类号: G10L19/16

    摘要: 本文描述一种用于对编码音频数据的位流进行解码的音频解码器,其中所述编码音频数据的位流表示音频样本值的序列并包括多个帧,其中每一帧包括相关联的编码音频样本值,所述音频解码器包括:确定器,所述确定器经配置以确定所述编码音频数据的位流的帧是否是包括与当前帧相关联的编码音频样本值及额外信息的即时播放帧;及初始化器,所述初始化器经配置以在所述确定器确定所述帧是即时播放帧时初始化所述解码器,其中初始化所述解码器包括在对与所述当前帧相关联的所述编码音频样本值进行解码之前对由所述额外信息包括的所述编码音频样本值进行解码。进一步描述一种用于对所述编码音频数据的位流进行解码的方法,以及一种音频编码器、一种音频编码器的系统及一种用于生成具有即时播放帧的所述编码音频数据的位流的方法。此外,还描述一种用于在编码音频数据的位流中生成即时播放帧或用于从编码音频数据的位流中移除即时播放帧的设备及相应的非暂时性数字存储媒体。

    用于处理虚拟现实环境中的听音位置之间的全局过渡的方法和系统

    公开(公告)号:CN111527760B

    公开(公告)日:2022-12-20

    申请号:CN201880081930.0

    申请日:2018-12-18

    IPC分类号: H04S7/00 G06F3/01

    摘要: 描述了一种用于在虚拟现实渲染环境(180)中渲染音频的方法(900)。所述方法(900)包括从围绕监听器(181)的听音位置(201)的球体(114)上的原始源位置渲染(901)原始音频场景(111)的原始音频源(113)的原始音频信号。此外,所述方法(900)包括确定(902)所述监听器(181)从所述原始音频场景(111)内的所述听音位置(201)移动到不同的目的地音频场景(112)内的听音位置(202)。此外,所述方法(900)包括将淡出增益应用(903)到所述原始音频信号以确定经修改的原始音频信号;以及从围绕所述听音位置(201,202)的所述球体(114)上的所述原始源位置渲染(903)所述原始音频源(113)的所述经修改的原始音频信号。

    用于MPEG-H 3D音频的三自由度(3DOF+)扩展的方法、设备和系统

    公开(公告)号:CN113993061A

    公开(公告)日:2022-01-28

    申请号:CN202111294219.3

    申请日:2019-04-09

    IPC分类号: H04S7/00

    摘要: 本申请涉及用于MPEG‑H 3D音频的三自由度(3DOF+)扩展的方法、设备和系统。描述了一种处理指示音频对象的对象位置的位置信息的方法,其中所述对象位置可用于渲染所述音频对象,所述方法包括:获得指示收听者头部的朝向的收听者朝向信息;获得指示所述收听者头部的位移的收听者位移信息;根据所述位置信息确定所述对象位置;通过对所述对象位置应用平移基于所述收听者位移信息修改所述对象位置;以及基于所述收听者朝向信息进一步修改经过修改的对象位置。进一步描述了一种用于处理指示音频对象的对象位置的位置信息的对应设备,其中所述对象位置可用于渲染所述音频对象。

    用于MPEG-H 3D音频的三自由度(3DOF+)扩展的方法、设备和系统

    公开(公告)号:CN113993058A

    公开(公告)日:2022-01-28

    申请号:CN202111293974.X

    申请日:2019-04-09

    IPC分类号: H04S7/00

    摘要: 本申请涉及用于MPEG‑H 3D音频的三自由度(3DOF+)扩展的方法、设备和系统。描述了一种处理指示音频对象的对象位置的位置信息的方法,其中所述对象位置可用于渲染所述音频对象,所述方法包括:获得指示收听者头部的朝向的收听者朝向信息;获得指示所述收听者头部的位移的收听者位移信息;根据所述位置信息确定所述对象位置;通过对所述对象位置应用平移基于所述收听者位移信息修改所述对象位置;以及基于所述收听者朝向信息进一步修改经过修改的对象位置。进一步描述了一种用于处理指示音频对象的对象位置的位置信息的对应设备,其中所述对象位置可用于渲染所述音频对象。

    用于处理虚拟现实环境中的听音位置之间的全局过渡的方法和系统

    公开(公告)号:CN116017264A

    公开(公告)日:2023-04-25

    申请号:CN202211608806.X

    申请日:2018-12-18

    摘要: 本申请涉及用于处理虚拟现实环境中的听音位置之间的全局过渡的方法和系统。描述了一种用于在虚拟现实渲染环境(180)中渲染音频的方法(900)。所述方法(900)包括从围绕监听器(181)的听音位置(201)的球体(114)上的原始源位置渲染(901)原始音频场景(111)的原始音频源(113)的原始音频信号。此外,所述方法(900)包括确定(902)所述监听器(181)从所述原始音频场景(111)内的所述听音位置(201)移动到不同的目的地音频场景(112)内的听音位置(202)。此外,所述方法(900)包括将淡出增益应用(903)到所述原始音频信号以确定经修改的原始音频信号;以及从围绕所述听音位置(201,202)的所述球体(114)上的所述原始源位置渲染(903)所述原始音频源(113)的所述经修改的原始音频信号。

    用于在虚拟现实环境中呈现音频信号的方法和系统

    公开(公告)号:CN114125690A

    公开(公告)日:2022-03-01

    申请号:CN202111411029.5

    申请日:2018-12-18

    IPC分类号: H04S7/00 H04S3/00

    摘要: 描述了一种用于在虚拟现实环境中呈现音频信号的方法(910)和系统。方法(910)包括从听音者(181)的起始听音位置(301)周围的起始球体(114)上的起始源位置呈现(911)音频源(311、312、313)的起始音频信号。此外,方法(910)包括确定(912)听音者(181)从起始听音位置(301)移动到目的地听音位置(302)。另外,方法(910)包括基于起始源位置来确定(913)音频源(311、312、313)在目的地听音位置(302)周围的目的地球体(114)上的目的地源位置,以及基于起始音频信号来确定(914)音频源(311、312、313)的目的地音频信号。此外,方法(910)包括从目的地听音位置(302)周围的目的地球体(114)上的目的地源位置呈现(915)音频源(311、312、313)的目的地音频信号。

    用于MPEG-H 3D音频的三自由度(3DOF+)扩展的方法、设备和系统

    公开(公告)号:CN113993059A

    公开(公告)日:2022-01-28

    申请号:CN202111293975.4

    申请日:2019-04-09

    IPC分类号: H04S7/00

    摘要: 本申请涉及用于MPEG‑H 3D音频的三自由度(3DOF+)扩展的方法、设备和系统。描述了一种处理指示音频对象的对象位置的位置信息的方法,其中所述对象位置可用于渲染所述音频对象,所述方法包括:获得指示收听者头部的朝向的收听者朝向信息;获得指示所述收听者头部的位移的收听者位移信息;根据所述位置信息确定所述对象位置;通过对所述对象位置应用平移基于所述收听者位移信息修改所述对象位置;以及基于所述收听者朝向信息进一步修改经过修改的对象位置。进一步描述了一种用于处理指示音频对象的对象位置的位置信息的对应设备,其中所述对象位置可用于渲染所述音频对象。