-
公开(公告)号:CN120071972A
公开(公告)日:2025-05-30
申请号:CN202510120197.0
申请日:2025-01-25
Applicant: 南京工程学院
IPC: G10L25/66 , G10L25/45 , G10L25/18 , G10L25/24 , G10L25/21 , G10L19/02 , G10L19/022 , G10L19/26 , G06N3/0464 , G06N3/0442
Abstract: 本发明公开了一种非侵入式语音评分预测方法、系统及介质,属于音频信号处理技术领域。本发明针对处方公式对语音评分预测的影响,融合语音标签优化策略,有效减小因处方公式差异导致的预测偏差,进一步提升模型预测精度;综合考虑语音清晰度映射对敏感性影响的问题,通过引入语音包络特征,实现语音清晰度评分预测精度的显著提升;相较于单任务学习,本发明采用多任务学习框架,通过任务间的协同作用提升各分支的预测性能,不仅可以共用模型中部分语音特征,节省计算资源,还可起到相互促进的作用,有利于预测精度的提升。
-
公开(公告)号:CN113993053B
公开(公告)日:2022-06-24
申请号:CN202111258499.2
申请日:2021-10-27
Applicant: 南京工程学院
IPC: H04R25/00
Abstract: 本发明公开一种通道自适应的数字助听器宽动态范围压缩方法,首先,通过模拟人耳听觉特性选择一种非对称滤波器组分解与综合算法,然后根据患者听力图并融合心理声学模型设计滤波器组通道数和参数,得到符合患者听损的个性化滤波器组;最后运用上述方法的数字助听器对输入的声音信号分通道进行宽动态范围压缩;压缩的具体步骤包括:对输入信号进行自适应通道滤波器组分解,得到自适应通道的信号;对分解后的每个通道信号进行响度补偿;对补偿后的各通道信号进行滤波器组综合,得到全带信号;将综合后的全带信号转换为声音信号输出。在满足性能要求的同时降低系统的计算复杂度,提高患者的言语可懂度。
-
公开(公告)号:CN119446166A
公开(公告)日:2025-02-14
申请号:CN202411674055.0
申请日:2024-11-21
Applicant: 南京工程学院
Abstract: 本发明公开了一种基于融合空间特征的多通道语音增强方法,首先从带噪多通道语音中分别提取多通道复频谱特征和融合空间特征,再将提取的多通道复频谱特征和融合空间特征输入深度神经网络进行处理并设定处理目标为理想复值比率掩蔽,再构建基于复卷积编码器解码器结构的深度复卷积循环语音增强网络,再利用深度复卷积循环语音增强网络对多通道复频谱特征和融合空间特征进行处理,输出预测复值比率掩蔽。本发明充分整合光谱信息、方向特征、通道间特征和相关系数特征,并对动态声源进行空间建模,使得网络对于语音信号的理解和处理能力远超传统方法,能够有效应对复杂多变的语音场景,有效地提升静态场景和动态场景下的语音增强效果。
-
公开(公告)号:CN119564200A
公开(公告)日:2025-03-07
申请号:CN202411646554.9
申请日:2024-11-18
Applicant: 南京工程学院 , 中国听力语言康复研究中心
IPC: A61B5/12 , G16H50/30 , G06N3/0442 , G06F18/25 , G06F18/22
Abstract: 本发明公开了一种基于言语测听的听障患者听损评测方法及系统,首先利用言语测听的原始音频数据构建具有原始音频声纹特征的语音合成模型,再清洗原始音频文本数据和用户反馈文本数据,接着采用语音合成模型将原始音频文本数据和用户反馈文本数据转换为音频信号并获得第一音频信号和第二音频信号,再将第一音频信号和第二音频信号进行傅里叶变换并计算各频点能量从而获得多组测听音频数据;本发明实现了具有自动评测患者听力状态的功能,且不需要额外的纯音测听过程,同时基于言语测听结果自动评测患者听力状态的方法能融合患者的个性信息进行评测,不仅评测效率较高,还使得评测结果更为准确,适合被广泛推广和使用。
-
公开(公告)号:CN113993053A
公开(公告)日:2022-01-28
申请号:CN202111258499.2
申请日:2021-10-27
Applicant: 南京工程学院
IPC: H04R25/00
Abstract: 本发明公开一种通道自适应的数字助听器宽动态范围压缩方法,首先,通过模拟人耳听觉特性选择一种非对称滤波器组分解与综合算法,然后根据患者听力图并融合心理声学模型设计滤波器组通道数和参数,得到符合患者听损的个性化滤波器组;最后运用上述方法的数字助听器对输入的声音信号分通道进行宽动态范围压缩;压缩的具体步骤包括:对输入信号进行自适应通道滤波器组分解,得到自适应通道的信号;对分解后的每个通道信号进行响度补偿;对补偿后的各通道信号进行滤波器组综合,得到全带信号;将综合后的全带信号转换为声音信号输出。在满足性能要求的同时降低系统的计算复杂度,提高患者的言语可懂度。
-
-
-
-