-
公开(公告)号:CN109036382A
公开(公告)日:2018-12-18
申请号:CN201810930863.7
申请日:2018-08-15
Applicant: 武汉大学
Abstract: 本发明公开了一种基于KL散度的音频特征提取方法,包括:按类读取训练集中的音频文件,然后转化成对应的功率谱,计算得到训练集中不同声学场景的类间KL散度矩阵,划分KL滤波器的频率群,设计出KL滤波器;将训练集的功率谱通过KL滤波器,提取出基于类间KL散度的频谱特征;将KL频谱特征取对数并归一化后输入到卷积神经网络进行训练得到声学模型;读取测试集的音频文件,然后转化成对应的功率谱,通过KL滤波器提取出测试集对应的KL频谱特征;将测试集的KL频谱特征输入训练好的声学模型进行测试和评估,得到最终的声场景分类模型准确率。本发明应用到其他声场景分类事件中,可得到比传统的基于人耳的Mel特征提取方法更好的性能。
-
公开(公告)号:CN104978967B
公开(公告)日:2018-11-13
申请号:CN201510400001.X
申请日:2015-07-09
Applicant: 武汉大学
IPC: G10L19/008
Abstract: 本发明提供了用于降低空间参数误码率的三维音频编码方法及装置,以提高重建三维音频空间感知质量,包括将3D音频码流的3D空间参数部分作为MIB部分,为MIB部分添加窗W1;将3D音频码流的下混单声道信号部分作为LIB部分,并为MIB部分和LIB部分添加窗W2;选择窗W1和窗W2之一,随机产生一个度数d,从所选窗Wi中随机选取d个符号并进行模为2的异或运算,得到一个编码符号;返回生成新的编码符号,直至输出编码码流。本发明基于不等差错保护的思想,通过对重建三维音频空间感知质量起着更关键作用的空间参数部分的更重点保护,降低三维音频空间参数部分的误码率,提高重建三维音频的空间感知质量。
-
公开(公告)号:CN103928030B
公开(公告)日:2017-03-15
申请号:CN201410181636.0
申请日:2014-04-30
Applicant: 武汉大学
IPC: G10L19/008 , G10L19/002
Abstract: 本发明提供一种基于子带空间关注测度的可分级音频编码系统及方法,包括基于能量、频率和空间信息综合计算各子带的子带重要性测度并排序,根据综合测度的排序结果进行比特分配、残差量化编码,对子带排序编号的编码结果和残差量化编码都加入码流。本发明根据能量、频率和空间信息作为子带优先级分配策略,相比单纯利用能量或频率作为感知测度具有更明显的指导意义。
-
公开(公告)号:CN105654957A
公开(公告)日:2016-06-08
申请号:CN201510992687.6
申请日:2015-12-24
Applicant: 武汉大学
IPC: G10L19/008 , G10L19/04 , G10L19/26
CPC classification number: G10L19/008 , G10L19/04 , G10L19/26
Abstract: 本发明提供了一种联合声道间和声道内预测的立体声误码隐藏方法及系统,包括:S1利用上一帧两声道数据生成第一维纳滤波器,基于相邻帧的声道间数据关系相似原理,采用第一维纳滤波器和当前帧第一声道数据预测出当前帧第二声道数据S1(n);S2利用上一帧第二声道数据及上一帧第二声道的相似帧生成第二维纳滤波器,采用第二维纳滤波器和当前帧第二声道的相似帧预测出当前帧第二声道数据S2(n);S3采用S1(n)和S2(n)重构当前帧第二声道数据。本发明联合声道间预测数据和声道内数据共同对误码数据进行恢复,充分考虑到了声道间和声道内的数据的共同作用,从而可进一步提高解码音频的质量。
-
公开(公告)号:CN103456307B
公开(公告)日:2015-10-21
申请号:CN201310429973.2
申请日:2013-09-18
Applicant: 武汉大学
IPC: G10L19/005
Abstract: 本发明公开了一种音频解码器中帧差错隐藏的谱代替方法及系统,本发明方法根据上一帧和当前坏帧的线性预测滤波器参数确定当前坏帧的衰减因子,并根据当前坏帧衰减因子和/或当前坏帧的幅值增益、以及上一帧的谱参数获得当前坏帧的谱参数替代值。本发明用来处理音频解码器接收的坏帧,能提高解码后的音频序列的主客观质量。
-
公开(公告)号:CN103347245B
公开(公告)日:2015-03-25
申请号:CN201310273067.8
申请日:2013-07-01
Applicant: 武汉大学
IPC: H04S1/00
Abstract: 本发明公开了一种立体声系统中恢复声源方位信息的方法与装置,装置包括声学属性计算模块,信号预分配模块,重建声场声学属性计算模块,声学属性匹配模块,增益确定模块,信号分配模块。通过在原声场中获得听音点处的粒子速度,在重建声场中,通过左、右两路独立的放音通道进行立体声重放,对重建声场中的两个扬声器预分配信号,根据立体声系统产生的听音点处的粒子速度与原声场中听音点处的粒子速度一致性,建立声像方位恢复模型,得到扬声器信号的加权因子,然后对每个扬声器分配相应的信号,即可完成原声场的重建。本发明能够准确的恢复原声场中的声像方位信息,并且操作简单,稳定性高。
-
公开(公告)号:CN103165134B
公开(公告)日:2015-01-14
申请号:CN201310112757.5
申请日:2013-04-02
Applicant: 武汉大学
IPC: G10L19/16
Abstract: 本发明提供了音频信号高频参数编解码装置,利用多种模式恢复无法通过核心层编码的高频信号,从而能高效重建高频信号,以提高输出音频信号质量。音频信号高频参数编码装置包括分频模块、低频编码模块、时频变换模块、高频激励模块、增益计算模块、增益因子量化模块、高频信号重构模块、信噪比计算模块、模式选择模块、参数编码模块;音频信号高频参数解码装置包括参数分配模块、低频解码模块、解码时频变换模块、高频激励重建模块、能量因子计算模块、高频频域信号重建模块和逆时频变换模块。
-
公开(公告)号:CN102883246B
公开(公告)日:2014-10-22
申请号:CN201210408900.0
申请日:2012-10-24
Applicant: 武汉大学
IPC: H04R5/02
Abstract: 一种三维多声道音频系统扬声器组精简布设方法,包括采集精简前三维n声道音频系统中各个扬声器的空间位置信息,分析球面三角形扬声器组的所有组合并挑选仅包含单个扬声器的球面三角形扬声器组,剔除球面三角形面积最小的扬声器组所包含的单个扬声器,判断当前待精简扬声器数是否大于m,若大于m,继续执行简化过程,否则结束迭代,直到等于m,得到m声道精简系统扬声器组最优空间位置排布。采用本发明提供技术方案可以保证精简过程不影响听音中心点处的声音的物理特性。
-
公开(公告)号:CN102752701B
公开(公告)日:2014-09-17
申请号:CN201210237149.2
申请日:2012-07-10
Applicant: 武汉大学
IPC: H04R29/00
Abstract: 一种三维空间方位感知敏感度的测试装置及方法,包括能够转动的底盘、支脚、半圆弧形支架、人工头、长杆和无线扬声器,半圆弧支架采用左右两个支脚支撑在底盘上方,支脚和半圆弧支架之间采用轴承连接,以支持半圆弧支架转动;底盘中心上方设置人工头,人工头处于半圆弧支架的圆心;长杆设置在半圆弧支架的顶端,长杆能够沿着指向半圆弧支架的圆心的方向移动,无线扬声器设置在长杆接近半圆弧支架的圆心的一端。通过旋转人工头、半圆环以及移动长杆,就可以采集三维空间任意一点的声音。通过人工头采集即保证了实验数据采集的一致性,不受周围环境及采集人员的干扰,通过相应自适应的测试方法,能在电脑上完成测试,大大缩短了测试周期和工作量。
-
公开(公告)号:CN104023304A
公开(公告)日:2014-09-03
申请号:CN201410289376.9
申请日:2014-06-24
Applicant: 武汉大学
IPC: H04S3/00
Abstract: 一种五扬声器系统精简为四扬声器系统的方法,包括设替换扬声器组包括四个扬声器,获得四个扬声器合成一个虚拟声源所分配得到的信号,使用一个扬声器模拟虚拟声源,所述四个扬声器和虚拟声源均位于同一球面上,球面的球心位置为接收点,包括计算四个扬声器的初始分配系数并确定最终分配系数;对包含四个扬声器的多声道系统,用单个扬声器的原始信号加上步骤1中所得该扬声器分配得到的相应信号。传统Ando的四个扬声器合成一个虚拟声源的方法给出一系列扬声器的分配系数,但未给出最优的扬声器的分配系数,本发明的方法可以获得四个扬声器合成一个虚拟声源的最优分配系数,有利于提升合成虚拟声源的效果。
-
-
-
-
-
-
-
-
-