一种3D音频空间参数全方位非均匀量化编码系统及方法

    公开(公告)号:CN104464742B

    公开(公告)日:2017-07-11

    申请号:CN201410855935.8

    申请日:2014-12-31

    Applicant: 武汉大学

    Abstract: 本发明提供一种3D音频空间参数全方位非均匀量化编码系统及方法,包括基于双声道输入信号进行预处理、声道信号下混、下混信号量化编码;按子带提取空间参数,所述空间参数为声道间强度差异参数ICLD;根据全方位角度JND得到全方位角度量化表;根据输入的扬声器的空间位置信息,建立在两扬声器所夹区域之间所形成虚拟声像的方位角与空间参数的映射表,从全方位角度量化表映射得到空间参数量化表;进行空间参数全方位的非均匀量化压缩编码,对输入的扬声器空间位置信息进行熵编码。本发明基于人耳对全方位的角度感知差异特性自适应地根据扬声器方位信息生成全方位空间参数非均匀量化表,相比现有方法,本发明明显提高了编码效率和质量。

    基于深度神经网络的音频带宽扩展编码解码方法及装置

    公开(公告)号:CN105070293A

    公开(公告)日:2015-11-18

    申请号:CN201510549716.1

    申请日:2015-08-31

    Applicant: 武汉大学

    Abstract: 本发明公开了一种基于深度神经网络的音频带宽扩展编码解码方法,装置包括编码单元与解码单元。编码单元包络预处理模块、高频参数提取模块、低频编码模块、码流生成模块;解码单元包括码流输入模块、高频参数解码模块、低频信号解码模块、自编码器参数预测模块、深度神经网络精细结构预测模块、高频信号重构模块、信号合成模块。本发明首先利用信号低频部分与高频部分存在的自相关性,使用深度神经网络预测的方法,预测高频部分的精细结构。再将精细结构与编码端得到高频部分的边信息相结合,重构出信号的高频部分。最后将信号高频部分与低频部分融合,得到最终的恢复信号。本发明相比传统方法在码率上大幅降低,且音质与传统方法相当。

    一种基于CFA的数码相机型号识别方法

    公开(公告)号:CN103065155B

    公开(公告)日:2015-11-04

    申请号:CN201210562185.6

    申请日:2012-12-21

    Applicant: 武汉大学

    Abstract: 本发明涉及一种多媒体取证技术,特别是一种基于CFA的数码相机型号识别方法,以解决图像来源可靠性鉴别的问题。利用不同数码相机型号会采用不同的CFA排布和对应的后处理算法这一机理,依据CFA排布找出采样与非采样像素点集合间的周期性及统计规律的不同,从而实现相机型号的识别。本发明可应用于数字图像鉴权系统的制定,对性能较好的数字图像来源识别方法的使用取得主动权。

    一种3D音频空间参数全方位非均匀量化编码系统及方法

    公开(公告)号:CN104464742A

    公开(公告)日:2015-03-25

    申请号:CN201410855935.8

    申请日:2014-12-31

    Applicant: 武汉大学

    Abstract: 本发明提供一种3D音频空间参数全方位非均匀量化编码系统及方法,包括基于双声道输入信号进行预处理、声道信号下混、下混信号量化编码;按子带提取空间参数,所述空间参数为声道间强度差异参数ICLD;根据全方位角度JND得到全方位角度量化表;根据输入的扬声器的空间位置信息,建立在两扬声器所夹区域之间所形成虚拟声像的方位角与空间参数的映射表,从全方位角度量化表映射得到空间参数量化表;进行空间参数全方位的非均匀量化压缩编码,对输入的扬声器空间位置信息进行熵编码。本发明基于人耳对全方位的角度感知差异特性自适应地根据扬声器方位信息生成全方位空间参数非均匀量化表,相比现有方法,本发明明显提高了编码效率和质量。

    一种音频编码带宽扩展中子带划分的量化方法及装置

    公开(公告)号:CN104282311A

    公开(公告)日:2015-01-14

    申请号:CN201410524838.0

    申请日:2014-09-30

    Abstract: 本发明涉及一种音频编码带宽扩展中子带划分的量化方法及装置,本发明对训练样本高频信号依次进行四次分割,每次分割时按照两个新子带的样点标准差乘积最小值获取样点分割点,最终获取16个样点分割点,以此16个样点分割点对输入的音频编码带宽进行扩展,可以获得更好的高频频谱结构,更接近高频频谱形状,从而提高高频频谱重建质量;本发明使用的子带划分方法充分考虑子带量化中的统计特性,相比巴克带或均匀划分方式,本发明的主观听力MOS分略有提升,信噪比有明显提升。

    一种ISF系数矢量量化的方法与装置

    公开(公告)号:CN104269176A

    公开(公告)日:2015-01-07

    申请号:CN201410524836.1

    申请日:2014-09-30

    Abstract: 本发明涉及一种ISF系数矢量量化方法与装置,将训练好的多区域码表中的ISF系数转化为LPC系数,分别获取区域索引Choosen_cluster(i)、第一级矢量量化VQ的索引VQ(j)和第二级分裂矢量量化SVQ的索引SVQ[5]对待量化的ISF[16]系数进行量化,得到量化后的ISF_q[16],进一步得到当前帧量化后的LPC_q[16],将原始的LPC[16]系数通过功率谱计算公式得到对应的功率谱pf[128];将得到的当前帧量化后的LPC_q[16]系数和原始LPC[16]系数对应的功率谱pf[128]计算出当前区域对应的谱失真SD,并与上一个区域的谱失真进行比较,获取最小的谱失真SD,将最小谱失真对应的区域索引Choosen_cluster(i)和第一级矢量量化后的索引VQ(j)以及第二级分裂矢量量化后的索引SVQ[5]输出,完成ISF系数矢量量化。本发明仅使用42bit量化16阶ISF系数,相比AMR-WB+的46bit,少了4bit。

    一种立体声系统中恢复声源方位信息的方法与装置

    公开(公告)号:CN103347245A

    公开(公告)日:2013-10-09

    申请号:CN201310273067.8

    申请日:2013-07-01

    Applicant: 武汉大学

    Abstract: 本发明公开了一种立体声系统中恢复声源方位信息的方法与装置,装置包括声学属性计算模块,信号预分配模块,重建声场声学属性计算模块,声学属性匹配模块,增益确定模块,信号分配模块。通过在原声场中获得听音点处的粒子速度,在重建声场中,通过左、右两路独立的放音通道进行立体声重放,对重建声场中的两个扬声器预分配信号,根据立体声系统产生的听音点处的粒子速度与原声场中听音点处的粒子速度一致性,建立声像方位恢复模型,得到扬声器信号的加权因子,然后对每个扬声器分配相应的信号,即可完成原声场的重建。本发明能够准确的恢复原声场中的声像方位信息,并且操作简单,稳定性高。

    基于感知特性的三维音频空间参数的量化方法

    公开(公告)号:CN103065634A

    公开(公告)日:2013-04-24

    申请号:CN201210558954.5

    申请日:2012-12-20

    Applicant: 武汉大学

    Abstract: 目前三维音频信号大多在本地存储和播放,一般没有对其进行编码压缩或仅仅对每个声道单独编码,码率会随声道数呈线性增长,音频文件数据量就会非常大。通过参数化的编码方法能大幅提高压缩比,然而空间信息码率也会随着声道数的增加而线性增长,如果码率受到实时转播带宽和存储媒介容量限制的情况下,参数量化误差会导致三维音频的空间方位感失真,三维音频的重建效果会显著下降。本发明提供一种基于感知特性的三维音频空间参数的量化方法,针对这些问题,通过获取不同方位的感知阈值,生成了非均匀的量化表,相对于传统的均匀量化表有效减低参数的编码码率。

    一种五个扬声器的三维平移方法

    公开(公告)号:CN102984642A

    公开(公告)日:2013-03-20

    申请号:CN201210551276.X

    申请日:2012-12-18

    Applicant: 武汉大学

    Abstract: 本发明提出了一种五个扬声器的三维平移方法,包括步骤:判断虚拟声源(被替换的单个扬声器)与五个替换扬声器的位置关系;所有扬声器位置测量与记录;按照虚拟声源(被替换单个扬声器)在接收点处产生的时间平均声音强度和声压与五个替换扬声器在接收点处产生的平均声音强度和声压相等的原则,计算被替换单个扬声器的信号分配到五个替换扬声器信号的分配系数;删除虚拟声源,分配信号。本发明提供的五个扬声器的三维平移方法,可以用五个替换扬声器替换一个虚拟声源(被替换扬声器),相较于扬声器数目较少的平移方法避免了五个扬声器情形下的分组和信号分配的多次调整,有利于在五个扬声器的情况下快速进行信号分配。

    基于深度神经网络的音频带宽扩展编码解码方法及装置

    公开(公告)号:CN105070293B

    公开(公告)日:2018-08-21

    申请号:CN201510549716.1

    申请日:2015-08-31

    Applicant: 武汉大学

    Abstract: 本发明公开了一种基于深度神经网络的音频带宽扩展编码解码方法,装置包括编码单元与解码单元。编码单元包络预处理模块、高频参数提取模块、低频编码模块、码流生成模块;解码单元包括码流输入模块、高频参数解码模块、低频信号解码模块、自编码器参数预测模块、深度神经网络精细结构预测模块、高频信号重构模块、信号合成模块。本发明首先利用信号低频部分与高频部分存在的自相关性,使用深度神经网络预测的方法,预测高频部分的精细结构。再将精细结构与编码端得到高频部分的边信息相结合,重构出信号的高频部分。最后将信号高频部分与低频部分融合,得到最终的恢复信号。本发明相比传统方法在码率上大幅降低,且音质与传统方法相当。

Patent Agency Ranking