-
公开(公告)号:CN118675542A
公开(公告)日:2024-09-20
申请号:CN202310247175.1
申请日:2023-03-15
Applicant: 桂林电子科技大学
IPC: G10L21/0272 , G10L25/30
Abstract: 本发明公开了一种混响环境下基于注意力加权的多通道语音分离方法,首先,利用多通道麦克风阵列收集混合语言;其次,对各个麦克风收集到的语音进行快速傅里叶变换得到混合语音信号时频谱,分别取各个通道语音信号的频域相位信息获得通道间相位差特征;然后引入自注意力机制的思想,采用打分加权的方式,对多组通道间相位差进行特征融合,与其它形式的特征拼接组成输入特征;最后将输入特征送入当下流行的时域卷积网络系统模型中迭代训练,得到语音分离模型。该方法采用加权打分的方式,解决了麦克风通道浪费的问题,尽可能多的使用通道间相位差,减少了语音信号空间信息的损失,使得语音分离性能得到了提升。
-
公开(公告)号:CN116400296A
公开(公告)日:2023-07-07
申请号:CN202310535545.1
申请日:2023-05-12
Applicant: 桂林电子科技大学
IPC: G01S5/20
Abstract: 本发明针对室内多声源同时发声导致声源分类效果以及定位能力不足的问题,提出了一种在室内复杂声场环境中,同时定位多个同时发声声源以及将声源位置信息显示的方法。该方法能够在多个声源同时发声的情况下对麦克风阵列节点进行分簇,基于节点内能量与节点间能量比的分簇方法和节点之间协作定位算法,实现复杂声场环境中多声源的定位以及成像,避免了传统分簇方法无法同时进行多个声源的区分的弊端。有效利用多传感信息,提高声源定位性能。并能在摄像头上显示声源位置信息,方便进行下一步的语音信号处理。
-
公开(公告)号:CN115835108A
公开(公告)日:2023-03-21
申请号:CN202211551762.1
申请日:2022-12-05
Applicant: 桂林电子科技大学
IPC: H04R19/04
Abstract: 本发明属于I2S接口MEMS麦克风语音采样数据传输技术领域,具体涉及一种单通道模式数字MEMS麦克风I2S接口与单差分总线接口转换传输方法。MEMS麦克风协议接口模块为从机状态时,等待接收远端设备下发的配置指令,配置指令包含配置帧同步码和MEMS麦克风配置信息。协议模块在正确识别到帧同步码和完成配置指令接收后,协议模块由接收状态切换至发送状态,MEMS麦克风按照配置指令内容采样音频数据,采样的数据依据串口通信的数据格式封装,然后通过单差分串行总线实时传输至远端设备。本发明利用I2S协议的空闲时序接收初始化指令提高了信号资源的利用率,同时采用单线差分串行总线传输减少IO接口数量,避免MEMS麦克风I2S总线在传输过程中电磁干扰。
-
公开(公告)号:CN109375223B
公开(公告)日:2022-08-16
申请号:CN201810988974.3
申请日:2018-08-28
Applicant: 桂林电子科技大学
Abstract: 本发明公开了基于声波粒二象性的室内空间感知与移动声源自定位方法,是利用智能手机作为声收发一体设备,采用非协作方式,通过设计与优化声脉冲测试信号,分析声场共振特性,感知室内声场环境空间尺寸,建立移动声源及其镜像的空间模型,构建空间点源与接收点之间的欧氏距离阵,并利用EDM秩的属性准确判断一阶声回波的飞行时间,再由多维尺度算法实时求解移动声源的位置信息,实现移动声源自定位的方法。本发明方法不依赖于应用场所的辅助设施及设备间的协作,摆脱了传统几何声学空间感知方法对视距信号信号的依赖,提高了空间感知与移动声源自定位方案的普适性,不仅适用于室内空间几何轮廓重构,也适用于室内环境的移动声源跟踪定位。
-
公开(公告)号:CN114155870A
公开(公告)日:2022-03-08
申请号:CN202111462331.3
申请日:2021-12-02
Applicant: 桂林电子科技大学
IPC: G10L21/0208 , G10L21/0216 , G10L21/0224 , G10L21/0232
Abstract: 本发明公开了一种低信噪比下基于SPP和NMF的环境音噪声抑制方法,包括如下步骤:1)声音预处理单元处理过程;2)自适应噪声处理单元处理过程;3)环境音重建单元处理过程。这种方法提升了在不同环境下对噪声抑制的鲁棒性,同时可以实现无时延的非平稳噪声估计,可以在低信噪比条件下从环境音和噪声高度重叠的谱带中准确地估计分离噪声,获得带噪环境音中的非平稳噪声信息,还能有效解决干扰噪声残留问题。
-
公开(公告)号:CN109785857B
公开(公告)日:2020-08-14
申请号:CN201910153124.6
申请日:2019-02-28
Applicant: 桂林电子科技大学
Abstract: 本发明公开了一种基于MFCC+MP融合特征的异常声事件识别方法,其特征是,包括如下步骤:1)第一次声音预处理;2)第一次声音特征提取;3)分类器训练;4)实测声音输入;5)第二次声音预处理;6)第二次特征提取;7)分类器的应用;8)检测结果输出。这种方法对噪声的鲁棒性好,能够在低信噪比环境下有效地检测到声音信号中存在的异常声音,解决了视频监控存在盲区的问题,为安保工作提供有利的帮助。
-
公开(公告)号:CN111278104A
公开(公告)日:2020-06-12
申请号:CN202010206114.7
申请日:2020-03-23
Applicant: 桂林电子科技大学
Abstract: 本发明公开了一种优化环境背景声特征指纹维度的方法,该方法对CSIE特征进行数据降维,在不损失原数据有效信息的前提下,对各个CSIE数据构成的指纹特征矩阵应用主成分分析法(Principal Components Analysis,PCA),提取指纹数据的关键信息,降低指纹数据冗余度,提高房间子区域的识别准确度,从而减少计算资源的浪费,实现室内定位系统的普适化。
-
公开(公告)号:CN111273231A
公开(公告)日:2020-06-12
申请号:CN202010206270.3
申请日:2020-03-23
Applicant: 桂林电子科技大学
IPC: G01S5/20
Abstract: 本发明公开了一种基于不同麦克风阵列拓扑结构分析的室内声源定位方法。该方法能够在改变麦克风阵列拓扑结构时,进行对声源的定位,并且分析出其误差并与其他类型阵列作对比。同时使用基于随机区域收缩的相位变换加权可控响应功率定位算法,在室内高混响条件下能够较好地得到定位结果。用户可以通过自己的需求选择相应的麦克风阵列拓扑结构进行分析。在选择符合自身需求的麦克风阵列后,可以使用多通道低通滤波与多通道自适应滤波融合的阵列校准方案对接收信号的幅频特性进行校准并提高定位精度。
-
公开(公告)号:CN110646764A
公开(公告)日:2020-01-03
申请号:CN201910966115.9
申请日:2019-10-12
Applicant: 桂林电子科技大学
IPC: G01S5/30
Abstract: 本发明公开了一种基于伪超声的室内定位系统及定位方法,伪超声是指频率在16kHz至20kHz范围内普通麦克风可接收但人耳不可闻的音频。该系统包括锚点端、接收端以及信号处理端,锚点端与接收端利用伪超声传输信息,属无线连接;接收端与信号处理端级联,属电连接。定位方法是锚点端发射伪超声音频信号;接收端接收到各个锚点发射的信号,处理后送至信号处理端;信号处理端接收并分析各锚点信号到达的时间差及相关信息,计算接收端的位置,实现准确定位。该系统中锚点结构简单,易于安装,可满足中小型室内场景下的定位需求,亦可以根据不同的室内环境,合理布置锚点位置。本系统不仅使用灵活,且成本低、精度高,极大的减小了系统复杂度。
-
公开(公告)号:CN110333484A
公开(公告)日:2019-10-15
申请号:CN201910633671.4
申请日:2019-07-15
Applicant: 桂林电子科技大学
Abstract: 本发明一种基于环境背景声感知与分析的室内区域级定位方法,首先通过智能手机麦克风感知室内各区域的环境背景声,并进行预处理;然后提取声信号的低阶声学指纹;其次,通过K均值聚类算法,结合房间几何轮廓信息先验,构建室内空间码本集,并获取声信号的高阶声学指纹;最后,将高阶声学指纹作为径向基函数核逆向传播神经网络的输入,经过线下训练,线上测试验证,输出用户位置信息。该方法由于引入了室内空间码本集,充分利用室内空间低阶声学指纹的多样性,能提高定位系统的准确率,同时由于引入了高阶声学指纹,充分利用室内空间声学特征的统计特性,提高了定位系统的稳定性,满足实时室内定位解决方案的性能要求。
-
-
-
-
-
-
-
-
-