用于短语音说话人确认的生成对抗网络优化方法及系统

    公开(公告)号:CN114530156A

    公开(公告)日:2022-05-24

    申请号:CN202210178590.1

    申请日:2022-02-25

    摘要: 本说明书实施例提供了一种用于短语音说话人确认的生成对抗网络优化方法及系统,其中,方法包括:获取多对长、短语音声学特征样本;将短语音声学特征样本输入生成器进行拼接,得到生成的伪长语音声学特征样本;将伪长语音声学特征样本与获取的所述长语音声学特征样本分别输入说话人确认模型,通过说话人确认模型输出伪身份特征样本和真身份特征样本;将真身份特征样本和伪身份特征样本输入鉴别器和分类器,通过损失函数计算所述鉴别器和分类器的损失,并通过反向传播优化更新鉴别器、分类器和生成器的参数。以解决说话人确认系统随着语音时长变短判别效果变差的问题。

    基于小波神经网络的声纹特征提取模型构建方法及系统

    公开(公告)号:CN114141256A

    公开(公告)日:2022-03-04

    申请号:CN202111492798.2

    申请日:2021-12-08

    IPC分类号: G10L17/18 G10L17/04

    摘要: 本发明公开了一种基于小波神经网络的声纹特征提取模型构建方法及系统,所述方法包括:获取特定格式的声音数据,对所述声音数据进行预处理,转化为固定维度的声音信号;选择小波基函数,将所述小波基函数设置为神经网络隐藏层中神经元的传递激发函数,构造小波神经网络,设置训练参数;将所述声音信号输入所述小波神经网络进行计算,基于输出的预测值和真实值,根据所述训练参数对小波神经网络进行迭代训练,获得声纹特征提取模型。使用的小波神经网络模型训练简单,专业性要求低,得到的特征提取模型抗噪性能优秀,具有更强的表征能力。

    基于嵌入增强的超短时说话人确认方法、设备及介质

    公开(公告)号:CN116612767B

    公开(公告)日:2023-10-13

    申请号:CN202310869117.2

    申请日:2023-07-17

    IPC分类号: G10L17/04 G10L17/18

    摘要: 本发明属于说话人确认技术领域,公开了一种基于嵌入增强的超短时说话人确认方法、设备及介质。本发明方法包括如下步骤:搭建网络模型,其包括预先训练好的说话人确认模型以及增强器模型;语音在网络模型中的处理流程如下:输入的语音首先经过说话人确认模型输出相对较差的第一说话人嵌入,紧接着该第一说话人嵌入输入到增强器模型后,得到相对较好的第二说话人嵌入;保持说话人确认模型的模型参数不变,使用训练语音对网络模型进行训练,从而优化增强器模型的模型参数,进而得到训练好的增强器模型;利用训练好的网络模型,对输入的语音进行说话人确。本发明利于提升现有的说话人确认模型在超短时条件下的说话人确认效果。