-
公开(公告)号:CN111666980A
公开(公告)日:2020-09-15
申请号:CN202010401071.8
申请日:2020-05-13
Applicant: 武汉大学
Abstract: 本申请提供一种基于轻量化网络的目标检测方法,首先获取待检测图像,并根据卷积神经网络得到目标处理值,所述目标处理值包括所述待检测图像的分辨率、所述卷积神经网络的深度以及宽度;根据所述目标处理值,进行复合优化处理,得到所述卷积神经网络的最大精确度(ACC)和浮点运算速率(FLOPS);将所述最大精确度(ACC)和浮点预设运算速率(FLOPS)进行优化处理,得到目标优化值,所述目标优化值用于衡量所述卷积神经网络中的基础网络的检测效率;最后利用优化后的卷积神经网络实现待检测图像的目标检测。本发明的有益效果:平衡卷积神经网络中的网络深度、网络宽度和网络分辨率,使得本案的目标提取方法输出的图片分辨率高且效率高。
-
公开(公告)号:CN111428765A
公开(公告)日:2020-07-17
申请号:CN202010185321.9
申请日:2020-03-17
Applicant: 武汉大学
Abstract: 本发明公开了一种基于全局卷积、局部深度卷积融合的目标检测方法,改变原来的三维区域建议网络,提出一种基于非对称分割深度感知的ASD网络结构用于目标检测。通过这样做,可以更充分地提取特征图中每个层次和深度的特征。此外,还引入水平和垂直卷积融合网络以及蒸馏网络、角度优化算法等创新技术,进一步提高了检测效果。
-
公开(公告)号:CN104978967B
公开(公告)日:2018-11-13
申请号:CN201510400001.X
申请日:2015-07-09
Applicant: 武汉大学
IPC: G10L19/008
Abstract: 本发明提供了用于降低空间参数误码率的三维音频编码方法及装置,以提高重建三维音频空间感知质量,包括将3D音频码流的3D空间参数部分作为MIB部分,为MIB部分添加窗W1;将3D音频码流的下混单声道信号部分作为LIB部分,并为MIB部分和LIB部分添加窗W2;选择窗W1和窗W2之一,随机产生一个度数d,从所选窗Wi中随机选取d个符号并进行模为2的异或运算,得到一个编码符号;返回生成新的编码符号,直至输出编码码流。本发明基于不等差错保护的思想,通过对重建三维音频空间感知质量起着更关键作用的空间参数部分的更重点保护,降低三维音频空间参数部分的误码率,提高重建三维音频的空间感知质量。
-
公开(公告)号:CN103928030B
公开(公告)日:2017-03-15
申请号:CN201410181636.0
申请日:2014-04-30
Applicant: 武汉大学
IPC: G10L19/008 , G10L19/002
Abstract: 本发明提供一种基于子带空间关注测度的可分级音频编码系统及方法,包括基于能量、频率和空间信息综合计算各子带的子带重要性测度并排序,根据综合测度的排序结果进行比特分配、残差量化编码,对子带排序编号的编码结果和残差量化编码都加入码流。本发明根据能量、频率和空间信息作为子带优先级分配策略,相比单纯利用能量或频率作为感知测度具有更明显的指导意义。
-
公开(公告)号:CN105654957A
公开(公告)日:2016-06-08
申请号:CN201510992687.6
申请日:2015-12-24
Applicant: 武汉大学
IPC: G10L19/008 , G10L19/04 , G10L19/26
CPC classification number: G10L19/008 , G10L19/04 , G10L19/26
Abstract: 本发明提供了一种联合声道间和声道内预测的立体声误码隐藏方法及系统,包括:S1利用上一帧两声道数据生成第一维纳滤波器,基于相邻帧的声道间数据关系相似原理,采用第一维纳滤波器和当前帧第一声道数据预测出当前帧第二声道数据S1(n);S2利用上一帧第二声道数据及上一帧第二声道的相似帧生成第二维纳滤波器,采用第二维纳滤波器和当前帧第二声道的相似帧预测出当前帧第二声道数据S2(n);S3采用S1(n)和S2(n)重构当前帧第二声道数据。本发明联合声道间预测数据和声道内数据共同对误码数据进行恢复,充分考虑到了声道间和声道内的数据的共同作用,从而可进一步提高解码音频的质量。
-
公开(公告)号:CN102752701B
公开(公告)日:2014-09-17
申请号:CN201210237149.2
申请日:2012-07-10
Applicant: 武汉大学
IPC: H04R29/00
Abstract: 一种三维空间方位感知敏感度的测试装置及方法,包括能够转动的底盘、支脚、半圆弧形支架、人工头、长杆和无线扬声器,半圆弧支架采用左右两个支脚支撑在底盘上方,支脚和半圆弧支架之间采用轴承连接,以支持半圆弧支架转动;底盘中心上方设置人工头,人工头处于半圆弧支架的圆心;长杆设置在半圆弧支架的顶端,长杆能够沿着指向半圆弧支架的圆心的方向移动,无线扬声器设置在长杆接近半圆弧支架的圆心的一端。通过旋转人工头、半圆环以及移动长杆,就可以采集三维空间任意一点的声音。通过人工头采集即保证了实验数据采集的一致性,不受周围环境及采集人员的干扰,通过相应自适应的测试方法,能在电脑上完成测试,大大缩短了测试周期和工作量。
-
公开(公告)号:CN102637432B
公开(公告)日:2013-12-18
申请号:CN201210074321.7
申请日:2012-03-20
Applicant: 武汉大学
Abstract: 为了解决三维音频中声道数过多、数据量过大的问题,通过将各声道下混并提取表达空间信息的双耳线索,可以有效降低三维音频的编码码率。本发明公开了一种三维音频编码中双耳线索感知特性的自适应测试方法,采取迂回逼近的方法,根据测试结果自适应调整双耳线索变化步长,来定位双耳线索的恰可感知差异,指导空间音频的量化编码。
-
公开(公告)号:CN101281748B
公开(公告)日:2011-06-15
申请号:CN200810047722.7
申请日:2008-05-14
Applicant: 武汉大学
Abstract: 本发明提供的空缺子带填充方法包括:接收编码码流,获取第一增强层编码索引和第二增强层编码索引;根据第一增强层编码索引确定解码信息,根据第二增强层编码索引确定解码信息;根据解码信息对未量化子带进行填充并作平滑处理,根据第一增强层解码信息初步填充第二增强层未能解码的高频成分,对填充子带和邻接子带做平滑处理。编码索引生成时第一增强层使用带宽扩展参数编码方法,带宽扩展参数编码索引作为第一增强层编码索引;第二增强层将低频残差信号和高频信号转换到频域后并量化,矢量量化编码索引作为第二增强层编码索引。本发明可以有效减少频谱空洞现象对解码信号产生的不良影响,提升解码信号的音质效果。
-
公开(公告)号:CN101699909A
公开(公告)日:2010-04-28
申请号:CN200910272646.4
申请日:2009-11-03
Applicant: 武汉大学
Abstract: 本发明涉及一种对无线Ad Hoc网络进行动态资源优化的调节方法,设置数据流源节点调节单元、干扰区域价格计算单元和目的节点反馈单元,执行获取干扰区域价格、获取链路动态调整价格、计算链路总体价格、计算链路净收益,最后寻求使净收益最高的发送速率,作为新的源节点发送速率。通过本发明,能够解决无线Ad Hoc网络动态不确定性问题,保证数据流业务都能得到最优的服务。本发明第一次提出在最优化的框架下考虑网络动态分配问题,使网络服务性能始终保持平滑过渡,最大限度减少了网络调节过程中的振荡,使控制效果具有更好的鲁棒性,从而使Ad Hoc网络服务质量性能得到提高。
-
公开(公告)号:CN101281748A
公开(公告)日:2008-10-08
申请号:CN200810047722.7
申请日:2008-05-14
Applicant: 武汉大学
Abstract: 本发明提供的空缺子带填充方法包括:接收编码码流,获取第一增强层编码索引和第二增强层编码索引;根据第一增强层编码索引确定解码信息,根据第二增强层编码索引确定解码信息;根据解码信息对未量化子带进行填充并作平滑处理,根据第一增强层解码信息初步填充第二增强层未能解码的高频成分,对填充子带和邻接子带做平滑处理。编码索引生成时第一增强层使用带宽扩展参数编码方法,带宽扩展参数编码索引作为第一增强层编码索引;第二增强层将低频残差信号和高频信号转换到频域后并量化,矢量量化编码索引作为第二增强层编码索引。本发明可以有效减少频谱空洞现象对解码信号产生的不良影响,提升解码信号的音质效果。
-
-
-
-
-
-
-
-
-