-
公开(公告)号:CN117174104A
公开(公告)日:2023-12-05
申请号:CN202311131991.2
申请日:2023-09-04
申请人: 昆明理工大学
IPC分类号: G10L21/0224 , G10L21/0232 , G10L25/30
摘要: 本发明涉及基于融合多路编码特征协同解码的单通道语音增强方法,属于音频信号处理技术领域。现有基于卷积编解码架构的单通道语音增强方法存在可用编码信息提炼不充分,用于解码的语音声学特征丢失严重的问题。因此本发明将语音自监督学习表征融入到语音幅度和复数谱中,通过融合的跨域特征提升网络对全局信息的建模能力;采用双支路编码器充分提取语音幅度和复数谱特征用于中间层建模和解码层重构语音信号;中间层分别从时间和频率维度对编码特征进行融合建模;在解码器中设计了多路信息聚合模块将上一解码层输出的特征和残差连接引入的编码特征进行聚合解码。本发明有效提高语音可理解和语音质量。
-
公开(公告)号:CN116863950A
公开(公告)日:2023-10-10
申请号:CN202310795845.3
申请日:2023-07-01
申请人: 昆明理工大学
IPC分类号: G10L21/02 , G10L21/0316 , G10L21/0216 , G10L25/45
摘要: 本发明涉及一种基于多注意力机制的单通道语音增强方法,属于音频信号处理技术领域。本发明在复数U‑Net网络中引入复数Conformer对语音幅度和相位的相关性进行建模,利用三维度注意力机制构造更加丰富的特征来增强卷积层的表示能力,通过门控注意力机制融合语音细节特征和深层特征。该方法能提高语音质量和可理解性,可用于嘈杂环境中的语音通信,口令控制及与语音相关任务的前处理部分。在公开数据集上的实验结果表明,所提方法在五种客观评价指标PESQ、CSIG、CBAK、COVL、STOI上,分别取得了的3.09、4.28、3.47、3.72、95.07评测结果,可有效降低噪声、提高语音质量和可理解性。
-
公开(公告)号:CN220340832U
公开(公告)日:2024-01-12
申请号:CN202321985625.9
申请日:2023-07-26
申请人: 昆明理工大学
IPC分类号: G09B23/18
摘要: 本实用新型涉及一种数字式可变电阻控制电路,属于电子技术实验教学领域。本实用新型包括电阻阻值预设电路、电阻阻值运算电路、电阻选通控制电路和电阻网络模块。其中,所述电阻阻值预设电路通过拨码开关输入设定电阻阻值;所述电阻阻值运算电路通过计数器、加法器、比较器逐次比较计算并选择不同阻值电阻进行搭配;所述电阻选通控制电路通过模拟开关或继电器控制电阻的通断;所述电阻网络由多个不同电阻串联构成,每个电阻通过并联模拟开关控制该电阻是否被短路。本实用新型可根据设定阻值控制电阻网络阻值,实现数字式可调电阻,让学生更好地掌握数字电路所涉及的基础知识,提高学习兴趣和动手能力。
-
-