一种采用双维度图注意力的伪造语音检测方法

    公开(公告)号:CN119864053A

    公开(公告)日:2025-04-22

    申请号:CN202510026212.5

    申请日:2025-01-08

    Abstract: 本发明涉及一种采用双维度图注意力的伪造语音检测方法,对原始语音进行预加重处理,提取每一帧的线性频率倒谱系数特征;根据线性频率倒谱系数特征并使用BP算法对真实语音和伪造语音进行GMM建模,采用期望最大化算法对训练数据进行迭代运算,直至收敛,统计语音帧数并分别计算每帧语音特征在各个高斯分量的LGP,再减去常数项并进行标准化处理;本发明通过采用双向细分法(BP)对高斯混合模型进行建模,使相邻高斯分量的均值向量差异较小,不仅使二维卷积能够有效地捕捉高斯分量之间的依赖关系,为图注意力模块提供更明确、更紧密的特征关系,增强注意力机制对全局特征的表征能力,该方法从局部到全局优化特征空间结构,提升伪造语音检测的性能。

    一种面向语音数据的身份隐私保护方法及系统

    公开(公告)号:CN117831510A

    公开(公告)日:2024-04-05

    申请号:CN202410068124.7

    申请日:2024-01-17

    Abstract: 本发明涉及身份隐私保护技术领域,具体涉及一种面向语音数据的身份隐私保护方法及系统,包括:语音特征提取模块,通过F0提取器、BN向量提取器和x‑vector提取器提取用户的语音信号的F0、BN向量和x‑vector;修改x‑vector模块,将得到的x‑vector通过三个独立训练的对抗样本生成器,生成匿名化x‑vector;语音合成模块,将F0、BN向量和匿名化x‑vector通过MFCC生成器生成MFCC,并将生成的MFCC与F0、匿名化x‑vector一同输入声码器,生成匿名化语音。本发明在保证安全性的同时,尽量保留数据的可用性,避免不必要的信息损失,更好地保留了原语音的音质和可懂度。

Patent Agency Ranking