Patent search ap:("山东省计算中心(国家超级计算济南中心)" OR "齐鲁工业大学(山东省科学院)") AND inv:"蔡田雨" Page 1

1.

发明授权
基于语音质量分级模型的变速率语音编码方法及系统有权

公开(公告)号：CN118016081B

公开(公告)日：2024-06-21

申请号：CN202410423860.X

申请日：2024-04-10

Applicant: 山东省计算中心(国家超级计算济南中心) , 齐鲁工业大学(山东省科学院)

Inventor： 李晔 , 吝灵霞 , 于兴业 , 张鹏 , 蔡田雨

IPC: G10L19/24 , G10L25/60

Abstract: 本公开提供了基于语音质量分级模型的变速率语音编码方法及系统，涉及语音信号处理技术领域，包括：获取编码器不同误码率下得到的合成语音文件；将所述合成语音文件输入至语音质量分级模型中，得到语音质量的预测结果；对未来可能出现的语音质量的变化情况进行模态划分；其中，语音质量的变化情况包括三种模态，分别为平衡态、休眠态以及激活态；判断当前预测出的语音质量的所属模态，并根据当前所属模态，实时地对语音编码的速率进行自适应调整，在语音编码的自然度、可懂度和系统容量间得到最佳平衡。

2.

发明公开
基于多尺度残差注意力的语音压缩方法及系统有权

公开(公告)号：CN118335092A

公开(公告)日：2024-07-12

申请号：CN202410748437.7

申请日：2024-06-12

Applicant: 山东省计算中心(国家超级计算济南中心) , 齐鲁工业大学(山东省科学院)

Inventor： 李晔 , 于兴业 , 吝灵霞 , 张鹏 , 蔡田雨

IPC: G10L19/16 , G10L25/30 , G10L13/02 , G10L19/00

Abstract: 本发明属于语音信号处理技术领域，提供了一种基于多尺度残差注意力的语音压缩方法及系统，包括获取语音信号；对语音信号进行卷积操作，得到第一特征，对第一特征进行操作，得到第一特征的残差和恒等映射；将残差和恒等映射相加得到第一输出特征，对第一输出特征进行特征提取，经过多次操作得到注意力分数，将注意力分数分别与残差和恒等映射相乘，经过多次操作得到第三输出特征；对第三输出特征进行多级迭代量化，得到第一矢量，第二网络根据接收到的第一矢量的索引，在码本中找到相应的量化矢量，将所有量化矢量相加，得到重构矢量；对重构矢量解码输出合成语音，并对生成语音的真伪通过判别器进行判断。本发明能够提高合成语音的质量。

3.

发明公开
基于语音质量分级模型的变速率语音编码方法及系统有权

公开(公告)号：CN118016081A

公开(公告)日：2024-05-10

申请号：CN202410423860.X

申请日：2024-04-10

Applicant: 山东省计算中心(国家超级计算济南中心) , 齐鲁工业大学(山东省科学院)

Inventor： 李晔 , 吝灵霞 , 于兴业 , 张鹏 , 蔡田雨

IPC: G10L19/24 , G10L25/60

Abstract: 本公开提供了基于语音质量分级模型的变速率语音编码方法及系统，涉及语音信号处理技术领域，包括：获取编码器不同误码率下得到的合成语音文件；将所述合成语音文件输入至语音质量分级模型中，得到语音质量的预测结果；对未来可能出现的语音质量的变化情况进行模态划分；其中，语音质量的变化情况包括三种模态，分别为平衡态、休眠态以及激活态；判断当前预测出的语音质量的所属模态，并根据当前所属模态，实时地对语音编码的速率进行自适应调整，在语音编码的自然度、可懂度和系统容量间得到最佳平衡。

4.

发明授权
面向低速率通信的非侵入式窄带语音质量评估方法及系统有权

公开(公告)号：CN119360900B

公开(公告)日：2025-03-18

申请号：CN202411918160.4

申请日：2024-12-25

Applicant: 齐鲁工业大学(山东省科学院) , 山东省计算中心(国家超级计算济南中心)

Inventor： 李晔 , 吝灵霞 , 于兴业 , 张鹏 , 蔡田雨

IPC: G10L25/60 , G10L25/30 , G10L25/18

Abstract: 本发明属于语音信号处理技术领域，提供了面向低速率通信的非侵入式窄带语音质量评估方法及系统，其技术方案为基于语音数据对构建好的语音质量评估模型进行训练得到训练后的语音质量评估模型；其中，所述语音质量评估模型的构建过程包括：提取语音数据的梅尔频谱特征；基于梅尔频谱特征提取得到语音数据的非对称特征图；将语音数据的非对称特征图分割为多个频段，对各个频段的特征进行增强，得到增强后的特征图；基于增强后的特征图计算每帧语音的评分，基于每帧语音的评分计算整个语音数据的评分；基于训练后的语音质量评估模型对待评估语音数据进行质量评估，无需原始参考信号，有效评估实际通信环境中的语音质量。

5.

发明公开
面向低速率通信的非侵入式窄带语音质量评估方法及系统有权

公开(公告)号：CN119360900A

公开(公告)日：2025-01-24

申请号：CN202411918160.4

申请日：2024-12-25

Applicant: 齐鲁工业大学(山东省科学院) , 山东省计算中心(国家超级计算济南中心)

Inventor： 李晔 , 吝灵霞 , 于兴业 , 张鹏 , 蔡田雨

IPC: G10L25/60 , G10L25/30 , G10L25/18

Abstract: 本发明属于语音信号处理技术领域，提供了面向低速率通信的非侵入式窄带语音质量评估方法及系统，其技术方案为基于语音数据对构建好的语音质量评估模型进行训练得到训练后的语音质量评估模型；其中，所述语音质量评估模型的构建过程包括：提取语音数据的梅尔频谱特征；基于梅尔频谱特征提取得到语音数据的非对称特征图；将语音数据的非对称特征图分割为多个频段，对各个频段的特征进行增强，得到增强后的特征图；基于增强后的特征图计算每帧语音的评分，基于每帧语音的评分计算整个语音数据的评分；基于训练后的语音质量评估模型对待评估语音数据进行质量评估，无需原始参考信号，有效评估实际通信环境中的语音质量。

6.

发明授权
基于多尺度残差注意力的语音压缩方法及系统有权

公开(公告)号：CN118335092B

公开(公告)日：2024-08-30

申请号：CN202410748437.7

申请日：2024-06-12

Applicant: 山东省计算中心(国家超级计算济南中心) , 齐鲁工业大学(山东省科学院)

Inventor： 李晔 , 于兴业 , 吝灵霞 , 张鹏 , 蔡田雨

IPC: G10L19/16 , G10L25/30 , G10L13/02 , G10L19/00

Abstract: 本发明属于语音信号处理技术领域，提供了一种基于多尺度残差注意力的语音压缩方法及系统，包括获取语音信号；对语音信号进行卷积操作，得到第一特征，对第一特征进行操作，得到第一特征的残差和恒等映射；将残差和恒等映射相加得到第一输出特征，对第一输出特征进行特征提取，经过多次操作得到注意力分数，将注意力分数分别与残差和恒等映射相乘，经过多次操作得到第三输出特征；对第三输出特征进行多级迭代量化，得到第一矢量，第二网络根据接收到的第一矢量的索引，在码本中找到相应的量化矢量，将所有量化矢量相加，得到重构矢量；对重构矢量解码输出合成语音，并对生成语音的真伪通过判别器进行判断。本发明能够提高合成语音的质量。

Search Results

Country/Region

Patent validity

Application date

Publication (announcement) day

applicant

The country/region where the applicant is located

Inventor

IPC

IPC Department

IPC class

IPC subclass

IPC group

IPC team

Appearance classification