一种语音检测方法、装置、电子设备及存储介质

    公开(公告)号:CN114783417B

    公开(公告)日:2023-03-24

    申请号:CN202210472519.4

    申请日:2022-04-29

    发明人: 孟凡芹 郑榕

    摘要: 本申请提供了一种语音检测方法、装置、电子设备及存储介质,语音检测方法包括:从目标语音信息中提取出语音特征信息;将目标语音信息输入到训练好的端到端模型中,得到目标语音信息对应的第一检测分数,以及将语音特征信息输入到训练好的非端到端模型中,得到目标语音信息对应的第二检测分数;根据第一检测分数和第二检测分数,确定目标语音信息对应的目标检测分数。本申请通过将端到端网络模型的第一检测分数与非端到端模型的第二检测分数相融合,使得对语音识别的检测能够结合两种不同模型的特征处理方式,便于更好的发挥每个模型在特征处理中的优势,弥补了单一网络模型在特征处理过程中的缺陷,从而提升了语音检测结果的准确率和稳定性。

    一种语音的重复音频检测方法、装置及存储介质

    公开(公告)号:CN115641856A

    公开(公告)日:2023-01-24

    申请号:CN202211597936.8

    申请日:2022-12-14

    发明人: 郑榕 孟凡芹

    摘要: 本申请提供了一种语音的重复音频检测方法、装置及存储介质,重复音频检测方法包括:对待检测语音进行分帧处理,对分帧处理后的待检测语音进行短时傅里叶变换特征提取;将多个短时傅里叶变换特征输入至预先训练好的重复音频检测模型的检测网络之中,确定出特征分段后的多个目标候选帧;将特征分段后多个目标候选帧输入至重复音频检测模型的编码器网络之中,确定出每个特征分段对应的嵌入表征特征向量;将各个特征分段对应的嵌入表征特征向量输入至重复音频检测模型的瓶颈网络之中,进行相似度计算,确定出待检测语音是否存在重复音频,若存在,则确定出重复音频的音频位置信息,提升了语音复制检测定位的检测速度以及准确性。

    心音信号的处理方法、装置、电子设备及可读存储介质

    公开(公告)号:CN112614503A

    公开(公告)日:2021-04-06

    申请号:CN202011475901.8

    申请日:2020-12-14

    发明人: 郑榕 孟凡芹

    IPC分类号: G10L21/0208

    摘要: 本申请提供了一种心音信号的处理方法、装置、电子设备及可读存储介质,通过对采集到的初始心音信号进行初级去噪处理,得到了去噪心音信号;按照得到的去噪心音信号对应的多个响度增益权重,增益放大去噪心音信号,得到放大后的放大心音信号,使得心音信号的每个频率的响度增益基本相同;再对放大后的放大心音信号进行去干扰处理,得到无干扰心音信号;最后,对得到的无干扰心音信号进行标注,得到可用于后续进行分析的目标心音信号,从而可以有效的滤除心音信号中的噪音,有助于减少心音信号中的干扰成分,进而,可以提高后期对心音信号进行分析时分析结果的准确性。

    一种语音合成与鉴伪评价的综合训练方法及装置

    公开(公告)号:CN115620748B

    公开(公告)日:2023-03-28

    申请号:CN202211552858.X

    申请日:2022-12-06

    发明人: 郑榕 孟凡芹

    IPC分类号: G10L25/60 G10L15/06 G10L13/02

    摘要: 本公开提供了一种语音合成与鉴伪评价的综合训练方法及装置,获取源语音以及目标语音作为输入语料;通过训练预设声音转换器进行语音转换;通过训练预设声音逆转换器进行语音逆转换;通过训练预设语音鉴伪器进行语音鉴伪;通过训练预设语音质量评估器进行语音质量评估;融合声音转换‑逆转换过程对应的语音转换损失函数、语音鉴伪器对应的语音鉴伪损失函数,以及语音质量评估器对应的质量评估损失函数构建目标损失函数进行最小化迭代。可以针对声音转换、语音评价、语音鉴伪检测三个任务进行综合训练优化,进而在提升语音的转换效果的同时,实现转换后声音的可检测性和可追溯性,对语音处理和声纹识别的潜在恶意攻击进行防御加固。

    一种语音合成与鉴伪评价的综合训练方法及装置

    公开(公告)号:CN115620748A

    公开(公告)日:2023-01-17

    申请号:CN202211552858.X

    申请日:2022-12-06

    发明人: 郑榕 孟凡芹

    IPC分类号: G10L25/60 G10L15/06 G10L13/02

    摘要: 本公开提供了一种语音合成与鉴伪评价的综合训练方法及装置,获取源语音以及目标语音作为输入语料;通过训练预设声音转换器进行语音转换;通过训练预设声音逆转换器进行语音逆转换;通过训练预设语音鉴伪器进行语音鉴伪;通过训练预设语音质量评估器进行语音质量评估;融合声音转换‑逆转换过程对应的语音转换损失函数、语音鉴伪器对应的语音鉴伪损失函数,以及语音质量评估器对应的质量评估损失函数构建目标损失函数进行最小化迭代。可以针对声音转换、语音评价、语音鉴伪检测三个任务进行综合训练优化,进而在提升语音的转换效果的同时,实现转换后声音的可检测性和可追溯性,对语音处理和声纹识别的潜在恶意攻击进行防御加固。

    一种虚假语音的识别方法、装置、电子设备及存储介质

    公开(公告)号:CN115497481A

    公开(公告)日:2022-12-20

    申请号:CN202211437338.4

    申请日:2022-11-17

    发明人: 郑榕 孟凡芹

    摘要: 本申请提供了一种虚假语音的识别方法、装置、电子设备及存储介质,包括:将声纹噪声向量输入至声纹噪声嵌入生成器中输出第一隐藏噪声嵌入向量,将鉴伪噪声向量输入至鉴伪噪声嵌入生成器中输出第二隐藏噪声嵌入向量;将待识别语音输入至声纹编码器模型之中输出声纹嵌入向量,将待识别语音输入至鉴伪编码器模型之中输出鉴伪嵌入向量;基于第一隐藏噪声嵌入向量、第二隐藏噪声嵌入向量、声纹嵌入向量以及鉴伪嵌入向量,确定出目标声纹增强向量以及目标鉴伪增强向量;将目标声纹增强向量以及目标鉴伪增强向量输入至检测模型之中,输出待识别语音是否为虚假语音。通过重构变分自动编码器对噪声嵌入分布进行估计,可以增强语音检测的准确率和效率。

    一种语音检测方法、装置、电子设备及存储介质

    公开(公告)号:CN114783417A

    公开(公告)日:2022-07-22

    申请号:CN202210472519.4

    申请日:2022-04-29

    发明人: 孟凡芹 郑榕

    摘要: 本申请提供了一种语音检测方法、装置、电子设备及存储介质,语音检测方法包括:从目标语音信息中提取出语音特征信息;将目标语音信息输入到训练好的端到端模型中,得到目标语音信息对应的第一检测分数,以及将语音特征信息输入到训练好的非端到端模型中,得到目标语音信息对应的第二检测分数;根据第一检测分数和第二检测分数,确定目标语音信息对应的目标检测分数。本申请通过将端到端网络模型的第一检测分数与非端到端模型的第二检测分数相融合,使得对语音识别的检测能够结合两种不同模型的特征处理方式,便于更好的发挥每个模型在特征处理中的优势,弥补了单一网络模型在特征处理过程中的缺陷,从而提升了语音检测结果的准确率和稳定性。

    一种伪造语音的识别方法、装置、电子设备及存储介质

    公开(公告)号:CN113257255B

    公开(公告)日:2021-09-21

    申请号:CN202110759437.3

    申请日:2021-07-06

    发明人: 郑榕 孟凡芹

    IPC分类号: G10L17/02 G10L17/04 G10L17/18

    摘要: 本申请提供了一种伪造语音的识别方法、装置、电子设备及存储介质,获取多个待鉴别语音,基于每个待鉴别语音的第一鉴别声纹特征第一伪造语音特征,确定第一声纹相似度和第一伪造分数;利用第一声纹相似度和第一伪造分数确定第二鉴别语音集合;基于每个待鉴别语音的第二鉴别声纹特征,确定第二声纹相似度,并基于第一声纹相似度和第二声纹相似度,确定第三鉴别语音集合;基于每个待鉴别语音的第二伪造语音特征,确定第二伪造分数,并基于第一伪造分数和第二伪造分数,确定第四鉴别语音集合;根据第三待鉴别语音集合与第四待鉴别语音集合确定目标人员的伪造语音。这样,本申请可以更好的提高目标人员伪造语音的检测结果准确率。

    一种标注图像处理方法及装置

    公开(公告)号:CN111402120B

    公开(公告)日:2024-03-29

    申请号:CN202010198455.4

    申请日:2020-03-19

    摘要: 本申请提供一种标注图像处理方法及装置,其中,标注图像处理方法应用于服务器,服务器与客户端之间采用加密协议进行通信,包括:接收客户端发送的获取待标注图像的请求;向客户端发送待标注图像;其中,待标注图像为与待标注的原始图像对应的一幅或者多幅模糊化图像;接收客户端发送的标注完成的标注信息,并将标注信息进行处理获取与原始图像对应的标注信息。因此,客户端与服务器之间采用加密协议进行通信,可以保证数据在服务器与客户端之间进行传输的安全性;此外,通过简单的对待标注图像的处理,包括模糊化处理、切分及重组处理等,在提高数据标注的安全性的基础上,降低了数据标注时安全管理的成本。

    一种虚假语音的检测方法、装置、电子设备及存储介质

    公开(公告)号:CN114596879A

    公开(公告)日:2022-06-07

    申请号:CN202210297859.8

    申请日:2022-03-25

    发明人: 孟凡芹 郑榕

    IPC分类号: G10L25/51 G10L25/30 G10L25/18

    摘要: 本申请提供了一种虚假语音的检测方法、装置、电子设备及存储介质,方法包括:获取待检测语音;将待检测语音输入语音检测模型的嵌入特征提取网络层,确定出全频带语音特征和多个子频带语音特征;将全频带语音特征和多个子频带语音特征输入组合注意力网络层,确定出全频带局部特征以及多个子频带局部特征;其中,全频带局部特征和子频带局部特征均是在至少一个注意力维度上进行特征提取确定的;将全频带局部特征和多个子频带局部特征输入融合注意力网络层,确定出目标语音融合特征;基于目标语音融合特征,确定出待检测语音是否为虚假语音。通过直接将待检测语音输入语音检测模型中在不同注意力维度上进行全频带和子频带的语音特征提取,从而可以提高对虚假语音识别的准确率。