Patent search ap:("杭州电子科技大学") AND inv:"谈林涛" Page 1

1.

发明公开
一种用于语音转换系统的音质评估方法审中-实审

公开(公告)号：CN117292677A

公开(公告)日：2023-12-26

申请号：CN202311294209.9

申请日：2023-10-09

Applicant: 杭州电子科技大学

Inventor： 简志华 , 谈林涛 , 闫铎文 , 杨曼 , 梁承涵 , 刘二小

IPC: G10L15/01 , G10L15/02 , G10L15/06 , G10L15/07 , G10L15/16 , G06N3/0442 , G06N3/0464 , G06N3/048 , G06N3/084

Abstract: 本发明提供一种用于语音转换系统的音质评估方法，先将语音数据进行文件格式转换，再使用神经网络模型对格式转换后的文件进行特征提取，构建损失函数，使用已标注MOS评价分数的公开语音数据集对神经网络模型进行训练，得到训练好的神经网络模型，用于实际评估。本方法通过对主观评价的分数进行预测，能在一定程度上代替语音的主观评价，省去了人工成本。另外，通过改变评测分数的类别，使预测的分数既可以是语音MOS分数，也可以是相似度分数，从而实现多类别的评价分数预测。

2.

发明公开
一种采用双维度图注意力的伪造语音检测方法审中-实审

公开(公告)号：CN119864053A

公开(公告)日：2025-04-22

申请号：CN202510026212.5

申请日：2025-01-08

Applicant: 杭州电子科技大学

Inventor： 简志华 , 梁承涵 , 蔡逸 , 闫铎文 , 谈林涛 , 杨曼

IPC: G10L25/51 , G10L25/24 , G10L25/45 , G10L25/30 , G10L25/18

Abstract: 本发明涉及一种采用双维度图注意力的伪造语音检测方法，对原始语音进行预加重处理，提取每一帧的线性频率倒谱系数特征；根据线性频率倒谱系数特征并使用BP算法对真实语音和伪造语音进行GMM建模，采用期望最大化算法对训练数据进行迭代运算，直至收敛，统计语音帧数并分别计算每帧语音特征在各个高斯分量的LGP，再减去常数项并进行标准化处理；本发明通过采用双向细分法(BP)对高斯混合模型进行建模，使相邻高斯分量的均值向量差异较小，不仅使二维卷积能够有效地捕捉高斯分量之间的依赖关系，为图注意力模块提供更明确、更紧密的特征关系，增强注意力机制对全局特征的表征能力，该方法从局部到全局优化特征空间结构，提升伪造语音检测的性能。

3.

发明公开
一种面向语音数据的身份隐私保护方法及系统审中-实审

公开(公告)号：CN117831510A

公开(公告)日：2024-04-05

申请号：CN202410068124.7

申请日：2024-01-17

Applicant: 杭州电子科技大学

Inventor： 简志华 , 闫铎文 , 谈林涛 , 杨曼 , 刘二小 , 张欢

IPC: G10L15/02 , G10L19/16 , G10L25/18 , G10L25/30

Abstract: 本发明涉及身份隐私保护技术领域，具体涉及一种面向语音数据的身份隐私保护方法及系统，包括：语音特征提取模块，通过F0提取器、BN向量提取器和x‑vector提取器提取用户的语音信号的F0、BN向量和x‑vector；修改x‑vector模块，将得到的x‑vector通过三个独立训练的对抗样本生成器，生成匿名化x‑vector；语音合成模块，将F0、BN向量和匿名化x‑vector通过MFCC生成器生成MFCC，并将生成的MFCC与F0、匿名化x‑vector一同输入声码器，生成匿名化语音。本发明在保证安全性的同时，尽量保留数据的可用性，避免不必要的信息损失，更好地保留了原语音的音质和可懂度。

Patent Agency Ranking