-
公开(公告)号:CN104282311A
公开(公告)日:2015-01-14
申请号:CN201410524838.0
申请日:2014-09-30
Applicant: 武汉大学深圳研究院
IPC: G10L19/032
Abstract: 本发明涉及一种音频编码带宽扩展中子带划分的量化方法及装置,本发明对训练样本高频信号依次进行四次分割,每次分割时按照两个新子带的样点标准差乘积最小值获取样点分割点,最终获取16个样点分割点,以此16个样点分割点对输入的音频编码带宽进行扩展,可以获得更好的高频频谱结构,更接近高频频谱形状,从而提高高频频谱重建质量;本发明使用的子带划分方法充分考虑子带量化中的统计特性,相比巴克带或均匀划分方式,本发明的主观听力MOS分略有提升,信噪比有明显提升。
-
公开(公告)号:CN104269176A
公开(公告)日:2015-01-07
申请号:CN201410524836.1
申请日:2014-09-30
Applicant: 武汉大学深圳研究院
IPC: G10L19/032
Abstract: 本发明涉及一种ISF系数矢量量化方法与装置,将训练好的多区域码表中的ISF系数转化为LPC系数,分别获取区域索引Choosen_cluster(i)、第一级矢量量化VQ的索引VQ(j)和第二级分裂矢量量化SVQ的索引SVQ[5]对待量化的ISF[16]系数进行量化,得到量化后的ISF_q[16],进一步得到当前帧量化后的LPC_q[16],将原始的LPC[16]系数通过功率谱计算公式得到对应的功率谱pf[128];将得到的当前帧量化后的LPC_q[16]系数和原始LPC[16]系数对应的功率谱pf[128]计算出当前区域对应的谱失真SD,并与上一个区域的谱失真进行比较,获取最小的谱失真SD,将最小谱失真对应的区域索引Choosen_cluster(i)和第一级矢量量化后的索引VQ(j)以及第二级分裂矢量量化后的索引SVQ[5]输出,完成ISF系数矢量量化。本发明仅使用42bit量化16阶ISF系数,相比AMR-WB+的46bit,少了4bit。
-
公开(公告)号:CN104269173B
公开(公告)日:2018-03-13
申请号:CN201410524839.5
申请日:2014-09-30
Applicant: 武汉大学深圳研究院
Abstract: 本发明涉及一种切换模式的音频带宽扩展编解码装置与方法,将输入的带宽信号进行语音信号、音频信号的分类并根据分类进行变换域带宽扩展编码或线性预测带宽扩展编码的选择,对高频信号或低频信号进行编码;根据不同的编码方式选择解码方式,合成高频信号。本发明综合考虑了语音和音频信号的类型差异,针对不同信号采用不同的带宽扩展策略。与AVS‑P10编码器相比,主观听力MOS分略有提升,客观质量信噪比提升明显。
-
公开(公告)号:CN104269176B
公开(公告)日:2017-11-24
申请号:CN201410524836.1
申请日:2014-09-30
Applicant: 武汉大学深圳研究院
IPC: G10L19/032
Abstract: 本发明涉及一种ISF系数矢量量化方法与装置,将训练好的多区域码表中的ISF系数转化为LPC系数,分别获取区域索引Choosen_cluster(i)、第一级矢量量化VQ的索引VQ(j)和第二级分裂矢量量化SVQ的索引SVQ[5]对待量化的ISF[16]系数进行量化,得到量化后的ISF_q[16],进一步得到当前帧量化后的LPC_q[16],将原始的LPC[16]系数通过功率谱计算公式得到对应的功率谱pf[128];将得到的当前帧量化后的LPC_q[16]系数和原始LPC[16]系数对应的功率谱pf[128]计算出当前区域对应的谱失真SD,并与上一个区域的谱失真进行比较,获取最小的谱失真SD,将最小谱失真对应的区域索引Choosen_cluster(i)和第一级矢量量化后的索引VQ(j)以及第二级分裂矢量量化后的索引SVQ[5]输出,完成ISF系数矢量量化。本发明仅使用42bit量化16阶ISF系数,相比AMR‑WB+的46bit,少了4bit。
-
公开(公告)号:CN104269173A
公开(公告)日:2015-01-07
申请号:CN201410524839.5
申请日:2014-09-30
Applicant: 武汉大学深圳研究院
Abstract: 本发明涉及一种切换模式的音频带宽扩展编解码装置与方法,将输入的带宽信号进行语音信号、音频信号的分类并根据分类进行变换域带宽扩展编码或线性预测带宽扩展编码的选择,对高频信号或低频信号进行编码;根据不同的编码方式选择解码方式,合成高频信号。本发明综合考虑了语音和音频信号的类型差异,针对不同信号采用不同的带宽扩展策略。与AVS-P10编码器相比,主观听力MOS分略有提升,客观质量信噪比提升明显。
-
公开(公告)号:CN104240712A
公开(公告)日:2014-12-24
申请号:CN201410524784.8
申请日:2014-09-30
Applicant: 武汉大学深圳研究院
IPC: G10L19/008
Abstract: 本发明涉及一种三维音频多声道分组聚类编码方法及系统,利用同一声源同组扬声器信号子带包络结构相似性的特点,提出一种基于子带频点极值包络相似性计算方法进行动态的三维音频分组下混,分组计算复杂度远低于传统的声道间相关性计算方法,但准确率相当。相比现有多声道下混编码方法,本方法能有效地将形成主要声像的多个扬声器进行分组,保证分组扬声器提取的空间参数信息更好地描述实际声像的空间位置信息,解决固定分组参数提取方法中带来的信息混叠问题。
-
公开(公告)号:CN104282311B
公开(公告)日:2018-04-10
申请号:CN201410524838.0
申请日:2014-09-30
Applicant: 武汉大学深圳研究院
IPC: G10L19/032
Abstract: 本发明涉及一种音频编码带宽扩展中子带划分的量化方法及装置,本发明对训练样本高频信号依次进行四次分割,每次分割时按照两个新子带的样点标准差乘积最小值获取样点分割点,最终获取16个样点分割点,以此16个样点分割点对输入的音频编码带宽进行扩展,可以获得更好的高频频谱结构,更接近高频频谱形状,从而提高高频频谱重建质量;本发明使用的子带划分方法充分考虑子带量化中的统计特性,相比巴克带或均匀划分方式,本发明的主观听力MOS分略有提升,信噪比有明显提升。
-
公开(公告)号:CN104240712B
公开(公告)日:2018-02-02
申请号:CN201410524784.8
申请日:2014-09-30
Applicant: 武汉大学深圳研究院
IPC: G10L19/008
Abstract: 本发明涉及一种三维音频多声道分组聚类编码方法及系统,利用同一声源同组扬声器信号子带包络结构相似性的特点,提出一种基于子带频点极值包络相似性计算方法进行动态的三维音频分组下混,分组计算复杂度远低于传统的声道间相关性计算方法,但准确率相当。相比现有多声道下混编码方法,本方法能有效地将形成主要声像的多个扬声器进行分组,保证分组扬声器提取的空间参数信息更好地描述实际声像的空间位置信息,解决固定分组参数提取方法中带来的信息混叠问题。
-
公开(公告)号:CN104363555A
公开(公告)日:2015-02-18
申请号:CN201410524837.6
申请日:2014-09-30
Applicant: 武汉大学深圳研究院
IPC: H04S3/00
Abstract: 本发明涉及一种5.1多声道声源方向重建装置与方法,根据已知的声源信号s(t),在原始声场中建立笛卡尔直角坐标系,计算听音点接收到的声源的方向矢量v0;选择包括该方向的4个扬声器,将s(t)分别乘以4个权值因子后分配到所选的四个扬声器上;计算重建声场中扬声器发出信号后听音点处所感知的声源的方向矢量v,建立原始声源的方向矢量v0和重建声场中声像的方向矢量v等价模型,求解该模型获得权值因子的值;利用求解的权值因子的值,进行扬声器的信号分配。本发明相对于现有技术,能够准确提取影响重建声像的方向信息的参数,从而能精确恢复原声源空间中的声源的方向信息。摒弃其它无关参数和冗余参数,计算效率高,操作简单,稳定性好。
-
-
-
-
-
-
-
-