基于多尺度残差注意力的语音压缩方法及系统

    公开(公告)号:CN118335092A

    公开(公告)日:2024-07-12

    申请号:CN202410748437.7

    申请日:2024-06-12

    Abstract: 本发明属于语音信号处理技术领域,提供了一种基于多尺度残差注意力的语音压缩方法及系统,包括获取语音信号;对语音信号进行卷积操作,得到第一特征,对第一特征进行操作,得到第一特征的残差和恒等映射;将残差和恒等映射相加得到第一输出特征,对第一输出特征进行特征提取,经过多次操作得到注意力分数,将注意力分数分别与残差和恒等映射相乘,经过多次操作得到第三输出特征;对第三输出特征进行多级迭代量化,得到第一矢量,第二网络根据接收到的第一矢量的索引,在码本中找到相应的量化矢量,将所有量化矢量相加,得到重构矢量;对重构矢量解码输出合成语音,并对生成语音的真伪通过判别器进行判断。本发明能够提高合成语音的质量。

    面向低速率通信的非侵入式窄带语音质量评估方法及系统

    公开(公告)号:CN119360900B

    公开(公告)日:2025-03-18

    申请号:CN202411918160.4

    申请日:2024-12-25

    Abstract: 本发明属于语音信号处理技术领域,提供了面向低速率通信的非侵入式窄带语音质量评估方法及系统,其技术方案为基于语音数据对构建好的语音质量评估模型进行训练得到训练后的语音质量评估模型;其中,所述语音质量评估模型的构建过程包括:提取语音数据的梅尔频谱特征;基于梅尔频谱特征提取得到语音数据的非对称特征图;将语音数据的非对称特征图分割为多个频段,对各个频段的特征进行增强,得到增强后的特征图;基于增强后的特征图计算每帧语音的评分,基于每帧语音的评分计算整个语音数据的评分;基于训练后的语音质量评估模型对待评估语音数据进行质量评估,无需原始参考信号,有效评估实际通信环境中的语音质量。

    面向低速率通信的非侵入式窄带语音质量评估方法及系统

    公开(公告)号:CN119360900A

    公开(公告)日:2025-01-24

    申请号:CN202411918160.4

    申请日:2024-12-25

    Abstract: 本发明属于语音信号处理技术领域,提供了面向低速率通信的非侵入式窄带语音质量评估方法及系统,其技术方案为基于语音数据对构建好的语音质量评估模型进行训练得到训练后的语音质量评估模型;其中,所述语音质量评估模型的构建过程包括:提取语音数据的梅尔频谱特征;基于梅尔频谱特征提取得到语音数据的非对称特征图;将语音数据的非对称特征图分割为多个频段,对各个频段的特征进行增强,得到增强后的特征图;基于增强后的特征图计算每帧语音的评分,基于每帧语音的评分计算整个语音数据的评分;基于训练后的语音质量评估模型对待评估语音数据进行质量评估,无需原始参考信号,有效评估实际通信环境中的语音质量。

    基于多尺度残差注意力的语音压缩方法及系统

    公开(公告)号:CN118335092B

    公开(公告)日:2024-08-30

    申请号:CN202410748437.7

    申请日:2024-06-12

    Abstract: 本发明属于语音信号处理技术领域,提供了一种基于多尺度残差注意力的语音压缩方法及系统,包括获取语音信号;对语音信号进行卷积操作,得到第一特征,对第一特征进行操作,得到第一特征的残差和恒等映射;将残差和恒等映射相加得到第一输出特征,对第一输出特征进行特征提取,经过多次操作得到注意力分数,将注意力分数分别与残差和恒等映射相乘,经过多次操作得到第三输出特征;对第三输出特征进行多级迭代量化,得到第一矢量,第二网络根据接收到的第一矢量的索引,在码本中找到相应的量化矢量,将所有量化矢量相加,得到重构矢量;对重构矢量解码输出合成语音,并对生成语音的真伪通过判别器进行判断。本发明能够提高合成语音的质量。

Patent Agency Ranking