基于多任务深度学习网络的螺旋麦克风阵列的声成像方法

    公开(公告)号:CN119165446A

    公开(公告)日:2024-12-20

    申请号:CN202411672346.6

    申请日:2024-11-21

    Applicant: 东南大学

    Abstract: 本发明公开了一种基于多任务深度学习网络的螺旋麦克风阵列的声成像方法。通过短时傅里叶变换STFT,将麦克风阵列捕获的音频信号转为频谱图,提取其实部和虚部作为特征输入。这些特征分别输入到双流结构的双注意力网络中,以自适应方式融合局部和全局特征。之后,两路输出融合并通过卷积层及双向门控循环单元Bi‑GRU层进一步处理。通过两个全连接层分别计算声源位置和声压分布。最后,成像模块将声压分布信息与摄像头图像结合,生成直观的声像图。本发明通过引入频谱图的实部和虚部分量作为特征输入的双流结构,并分别结合双注意力网络模块,实现了在较少阵元条件下进行实时声源定位与成像,并且具备较高的空间分辨率和较强的抗干扰能力。

    一种自适应的听力补偿方法

    公开(公告)号:CN105307093B

    公开(公告)日:2018-08-21

    申请号:CN201510835800.X

    申请日:2015-11-26

    Applicant: 东南大学

    Abstract: 本发明公开了一种自适应的听力补偿方法,本发明包括以下步骤:首先利用gammatone滤波器组对输入信号进行多通道分解,然后根据通道内信号的动态范围以及听损患者的听觉范围确定补偿方法,若通道信号经线性增益处理后仍在患者的听觉范围内则使用线性放大进行听力补偿以减小畸变,否则使用动态范围压缩进行补偿以增加可听度。另外,为减小动态范围压缩带来的信号畸变,提高噪声环境下输出信号的信噪比,采用自适应压缩方法进行听力补偿,使压缩比尽量接近于1。本发明相比已有的听力补偿方法,本发明补偿后的语音可懂度更高,具有很强的实用性。

    一种数字助听器的自适应验配方法

    公开(公告)号:CN106303874A

    公开(公告)日:2017-01-04

    申请号:CN201610974157.3

    申请日:2016-10-28

    Applicant: 东南大学

    CPC classification number: H04R25/50 H04R25/70 H04R2225/43

    Abstract: 本发明公开了一种数字助听器中自适应验配方法。传统的助听器验配过程离不开听力专家,验配的结果好坏直接取决于听力专家的专业水平,此外,对于发展中国家而言,相当一部分地区的医疗条件达不到验配标准,利用本方法可以有效地实现助听器的自适应验配,即脱离验配专家的助听器验配过程。本发明以二维高斯分布的求和形式作为验配模型,以交互式进化计算作为寻优方法,结合本发明设计的人机交互接口,通过30代以内的人机交互即可确定数字助听器的验配模型。实验结果表明,本发明提出的方法可以有效地实现数字助听器的自适应验配,摆脱了听力专家对于数字助听器验配过程的限制。

    基于多尺度空间信息与频谱特征融合的多通道语音增强方法

    公开(公告)号:CN119889338A

    公开(公告)日:2025-04-25

    申请号:CN202411912274.8

    申请日:2024-12-24

    Applicant: 东南大学

    Abstract: 本发明公开了基于多尺度空间信息与频谱特征融合的多通道语音增强方法,根据频谱特性将不同频谱成分重新组合,提取通道内、通道间以及全通道的特征模式;并对上述特征进行融合,创建统一深度特征;引入局部特征提取模块增强当前帧特征权重并通过特征注意力机制融合不同尺度下的特征;引入分解注意力机制,在多个分解空间融合编码器和解码器输出,让细节特征也能被深度模块使用。本发明将空间特征和频谱特征相结合,利用特征融合方法创建统一的特征表达。通过注意力模块自适应学习空间特征中所包含的模式并加以利用,而非拟合具有物理含义的方向性特征,能够更灵活地适应不同的场景,具有良好的应用前景。

    一种智能助听器交互式自验配方法

    公开(公告)号:CN112653980B

    公开(公告)日:2022-02-18

    申请号:CN202110035197.2

    申请日:2021-01-12

    Applicant: 东南大学

    Abstract: 本发明公开了一种智能助听器交互式自验配方法,包括如下步骤:步骤1,听障患者倾听助听器发出的测试语音进行五级评价,并形成助听器声音质量评价指标;步骤2,根据患者的11维听力图,3维个性信息,语音评价形成特征序列,然后计算其与验配历史数据库中的特征序列的相似度步骤3,设计参数调整的价值函数,计算参数调整策;略的价值,使得每次参数调整的价值最大化;步骤4,构建神经网络,获得神经网络的权值;步骤5,将测试语音频谱,语音评价,患者个性信息以及连续3组历史参数调整策略输入神经网络,重新生成测试语音给听障患者进行评价。本发明综合考虑主客观语音评价方法,结合深度学习网络,将认知和个人因素融入助听器设计,应用前景好。

    一种数字助听器的自适应验配方法

    公开(公告)号:CN106303874B

    公开(公告)日:2019-03-19

    申请号:CN201610974157.3

    申请日:2016-10-28

    Applicant: 东南大学

    Abstract: 本发明公开了一种数字助听器中自适应验配方法。传统的助听器验配过程离不开听力专家,验配的结果好坏直接取决于听力专家的专业水平,此外,对于发展中国家而言,相当一部分地区的医疗条件达不到验配标准,利用本方法可以有效地实现助听器的自适应验配,即脱离验配专家的助听器验配过程。本发明以二维高斯分布的求和形式作为验配模型,以交互式进化计算作为寻优方法,结合本发明设计的人机交互接口,通过30代以内的人机交互即可确定数字助听器的验配模型。实验结果表明,本发明提出的方法可以有效地实现数字助听器的自适应验配,摆脱了听力专家对于数字助听器验配过程的限制。

    一种自适应的听力补偿方法

    公开(公告)号:CN105307093A

    公开(公告)日:2016-02-03

    申请号:CN201510835800.X

    申请日:2015-11-26

    Applicant: 东南大学

    Abstract: 本发明公开了一种自适应的听力补偿方法,本发明包括以下步骤:首先利用gammatone滤波器组对输入信号进行多通道分解,然后根据通道内信号的动态范围以及听损患者的听觉范围确定补偿方法,若通道信号经线性增益处理后仍在患者的听觉范围内则使用线性放大进行听力补偿以减小畸变,否则使用动态范围压缩进行补偿以增加可听度。另外,为减小动态范围压缩带来的信号畸变,提高噪声环境下输出信号的信噪比,采用自适应压缩方法进行听力补偿,使压缩比尽量接近于1。本发明相比已有的听力补偿方法,本发明补偿后的语音可懂度更高,具有很强的实用性。

    基于行游程邻接表的乐谱快速连通域分析方法

    公开(公告)号:CN101930544B

    公开(公告)日:2012-11-14

    申请号:CN201010275849.1

    申请日:2010-09-07

    Applicant: 东南大学

    Abstract: 本发明公布了一种基于行游程邻接表的乐谱快速连通域分析方法,所述方法如下对图像F(x,y)由上至下进行行扫描,记录下各行的黑色游程信息,得到整幅图像的水平黑色游程信息表;建立重要信息统计矩阵向量;判断Yctable中的Flagi是否为1;计算第i行(即下一行)各游程段与第i-1行各游程段的邻接情况;统计游程邻接表第r行(即下一行的第r个游程段所对应的行)中1的个数;去掉废除后连通域编号的其它连通域编号所对应的ltyxsb就是分割后真正的各连通域所对应的像素信息;最后用方框标识出分割区域。

    一种智能助听器交互式自验配方法

    公开(公告)号:CN112653980A

    公开(公告)日:2021-04-13

    申请号:CN202110035197.2

    申请日:2021-01-12

    Applicant: 东南大学

    Abstract: 本发明公开了一种智能助听器交互式自验配方法,包括如下步骤:步骤1,听障患者倾听助听器发出的测试语音进行五级评价,并形成助听器声音质量评价指标;步骤2,根据患者的11维听力图,3维个性信息,语音评价形成特征序列,然后计算其与验配历史数据库中的特征序列的相似度步骤3,设计参数调整的价值函数,计算参数调整策;略的价值,使得每次参数调整的价值最大化;步骤4,构建神经网络,获得神经网络的权值;步骤5,将测试语音频谱,语音评价,患者个性信息以及连续3组历史参数调整策略输入神经网络,重新生成测试语音给听障患者进行评价。本发明综合考虑主客观语音评价方法,结合深度学习网络,将认知和个人因素融入助听器设计,应用前景好。

Patent Agency Ranking