-
公开(公告)号:CN113365202B
公开(公告)日:2024-10-22
申请号:CN202010144625.0
申请日:2020-03-04
申请人: 南京中兴新软件有限责任公司
发明人: 郭法永
IPC分类号: H04S7/00 , H04R5/027 , G10L19/008
摘要: 本发明实施例提供一种全息语音通信方法、装置、终端以及计算机存储介质,通过采集空间声场中不同位置至少一个音频信号,将音频信号组成信号向量,并生成全息声场数据,对全息声场数据进行仿耳廓效果处理,生成第一全息语音数据,将第一全息语音数据进行预定义场景模型处理,更新第一全息语音数据,将更新后的第一全息语音数据传输至接收端,作为接收端进行预定义场景转换处理从而生成第二全息语音数据,在某些实施过程中,可以实现空间声场数据采集灵活,提高通用性,还可以为声音实现不同的场景体验,增加真实临场语音体验。
-
公开(公告)号:CN118800256A
公开(公告)日:2024-10-18
申请号:CN202310444530.4
申请日:2023-04-13
申请人: 华为技术有限公司
IPC分类号: G10L19/008 , G10L25/27 , G10L25/48
摘要: 本申请提供一种场景音频信号的解码方法和装置。本申请场景音频信号的解码方法,包括:获取第一通道的重建信号,所述第一通道是重建场景音频信号包含的C个通道中采用直接解码处理的通道,C为正整数;获取第二通道的第一信号和暂态标识,所述第二通道是所述C个通道中没有采用直接解码处理的通道;当所述第二通道的暂态标识表示所述第二通道存在暂态信号时,获取所述第一通道的重建信号和所述第一信号之间的互相关值;根据所述互相关值获取所述第二通道的重建信号。本申请可以实现对场景音频信号中的暂态信号的处理,提升重建场景音频信号的质量和用户的听觉体验。
-
公开(公告)号:CN118800250A
公开(公告)日:2024-10-18
申请号:CN202310428890.5
申请日:2023-04-13
申请人: 华为技术有限公司
IPC分类号: G10L19/008 , G10L25/27 , G10L25/48
摘要: 本申请实施例提供了一种场景音频解码方法及电子设备。该方法包括:首先,接收码流;接着,基于解码方式组合对码流进行解码,以得到重建场景音频信号;其中,解码方式组合包括以下至少一种组合:第一解码方式、第二解码方式和第三解码方式的组合,第一解码方式和第三解码方式的组合;第一解码方式为解码对信号本身进行编码所得到的编码数据;第二解码方式为空间解码方式;第三解码方式为除第一解码方式和第二解码方式之外的编码方式。这样,能够在保证一定程度的音频质量的前提下,降低解码复杂度。
-
公开(公告)号:CN118800249A
公开(公告)日:2024-10-18
申请号:CN202310428888.8
申请日:2023-04-13
申请人: 华为技术有限公司
IPC分类号: G10L19/008 , G10L25/27 , G10L25/48
摘要: 本申请提供一种场景音频信号的解码方法和装置。本申请场景音频信号的解码方法,包括:接收码流;对所述码流采用至少两种解码方法进行解码,以得到重建场景音频信号,所述至少两种解码方法包括直接解码处理,所述重建场景音频信号包括C个通道的音频信号,C为正整数;对所述C个通道中需要进行暂态检测的M个通道进行暂态检测以得到所述M个通道的暂态标识,所述暂态标识用于表示对应通道是否存在暂态信号,1≤M≤C;根据所述M个通道的暂态标识对所述M个通道中存在暂态信号的通道进行暂态恢复。本申请可以实现对场景音频信号中的暂态信号的处理,从而提升重建音频信号的质量和用户的听觉体验。
-
公开(公告)号:CN118800248A
公开(公告)日:2024-10-18
申请号:CN202310409986.7
申请日:2023-04-13
申请人: 华为技术有限公司
IPC分类号: G10L19/008 , G10L25/27 , G10L25/48
摘要: 本申请实施例提供了一种场景音频解码方法及电子设备。该方法包括:首先,接收码流;接着,从解码方式集合中,确定与码流对应的解码方式组合,其中,解码方式集合包括多个解码方式组合;之后,基于与码流对应的解码方式组合对码流进行解码,以得到重建场景音频信号。这样,可以节省整个解码过程所消耗的时间,提高解码效率;且适用于针对不同场景的场景音频信号的解码;此外,由于建立解码方式集合通常选用编码性能较优的解码方式组合,因此本申请能够一定程度保证对各场景的场景音频信号的音频重建质量,灵活度高。
-
公开(公告)号:CN114333858B
公开(公告)日:2024-10-18
申请号:CN202111481150.5
申请日:2021-12-06
申请人: 安徽听见科技有限公司
IPC分类号: G10L19/008 , G10L19/18 , G10L21/0216 , H04R1/08 , H04R3/00
摘要: 本申请公开了一种音频编码及解码方法和相关装置、设备、存储介质,其中,音频编码方法包括:将采集到的音频信号转换为数字信号;基于采集音频信号时拾音设备的拾音模式,对数字信号进行编码,得到音频数据;其中,拾音模式用于表征拾音设备的各个声道分别导通的麦克风的类型,且每帧音频数据包含第一字段和第二字段,第一字段用于表征拾音模式,第二字段基于数字信号处理得到,且终端设备获取音频数据后,基于音频数据中的第二字段进行解码,得到数字信号。上述方案,能够在拾音设备支持多种拾音模式的情况下进行音频编解码。
-
公开(公告)号:CN118782078A
公开(公告)日:2024-10-15
申请号:CN202411156478.3
申请日:2019-04-25
申请人: 杜比国际公司
IPC分类号: G10L21/0388 , G10L19/008 , G10L19/02 , G10L19/24 , H04S3/00
摘要: 本公开涉及高频音频重建技术的集成。本发明揭示一种用于解码经编码音频位流的方法。所述方法包含接收所述经编码音频位流且解码音频数据以产生经解码低频带音频信号。所述方法进一步包含提取高频重建元数据且使用分析滤波器组来对所述经解码低频带音频信号滤波以产生经滤波低频带音频信号。所述方法还包含提取指示是对所述音频数据执行频谱平移还是谐波转置的标记且根据所述标记使用所述经滤波低频带音频信号及所述高频重建元数据来再生所述音频信号的高频带部分。将所述高频再生执行为每个音频频道具有3010个样本的延迟的后处理操作。
-
公开(公告)号:CN118782053A
公开(公告)日:2024-10-15
申请号:CN202410782025.5
申请日:2024-06-18
申请人: 深圳百瑞互联技术有限公司
IPC分类号: G10L19/008 , H04W4/80 , H04S7/00
摘要: 本申请公开了一种基于非负矩阵分解的蓝牙接收端单声道上混方法、装置、存储介质及设备,属于蓝牙音频技术领域,该方法包括:在蓝牙接收端,当输入为单声道音频码流时,对单声道音频码流执行解码至变换域噪声整形,得到谱系数及其对应的幅度谱系数;根据幅度谱系数构建幅度谱系数矩阵,并对幅度谱系数矩阵执行非负矩阵分解,得到基矩阵和激活矩阵;根据谱系数、幅度谱系数、基矩阵和激活矩阵,得到主声源谱系数和环境声谱系数;以及分别根据主声源谱系数和环境声谱系数,继续执行解码过程,得到主声源PCM数据和环境声PCM数据。本申请在蓝牙接收端,通过使用非负矩阵分解算法,根据单声道信号生成环境声,从而增强了用户的沉浸感。
-
公开(公告)号:CN118711601A
公开(公告)日:2024-09-27
申请号:CN202410978891.1
申请日:2019-07-02
IPC分类号: G10L19/16 , G10L19/18 , G10L19/008 , H04S3/00
摘要: 本公开涉及用于产生或解码包括沉浸式音频信号的位流的方法及装置。本文档描述一种用于产生位流(101)的方法(500),其中所述位流(101)包括用于沉浸式音频信号(111)的帧序列的超帧(400)序列。所述方法(500)包括针对所述超帧(400)序列重复地将从所述沉浸式音频信号(111)导出的一或多个降混声道信号(203)的一或多个帧的经编码音频数据(206)插入(501)到超帧(400)的数据字段(411、421、412、422)中;及将用于从所述经编码音频数据(206)重构所述沉浸式音频信号(111)的一或多个帧的元数据(202、205)插入(502)到所述超帧(400)的元数据字段(403)中。
-
公开(公告)号:CN113470667B
公开(公告)日:2024-09-27
申请号:CN202010167199.2
申请日:2020-03-11
申请人: 腾讯科技(深圳)有限公司
IPC分类号: G10L19/16 , G10L19/02 , G10L19/008
摘要: 本申请提供了一种语音信号的编解码方法、装置、电子设备及存储介质,该解码方法包括:获取待解码的码流,码流包括第一子码流,其中,第一子码流是对原始语音信号的低频子带信号采用第一编码方式进行编码得到的码流;若码流中未包含第二子码流,则基于第一子码流进行信号重建,得到重建的语音信号;若码流中包含至少一种第二子码流,则基于第一子码流和至少一种第二子码流进行信号重建,得到重建的语音信号;其中,各第二子码流是通过各自对应的第二编码方式对原始语音信号的高频子带信号进行编码得到的码流。基于该方案,能够有效提高解码端重建出语音信号的可能性,进一步的,在信号传输网络状态较好的情况下,能够重建得到质量很高的语音信号。
-
-
-
-
-
-
-
-
-