一种语音的重复音频检测方法、装置及存储介质

    公开(公告)号:CN115641856B

    公开(公告)日:2023-03-28

    申请号:CN202211597936.8

    申请日:2022-12-14

    发明人: 郑榕 孟凡芹

    摘要: 本申请提供了一种语音的重复音频检测方法、装置及存储介质,重复音频检测方法包括:对待检测语音进行分帧处理,对分帧处理后的待检测语音进行短时傅里叶变换特征提取;将多个短时傅里叶变换特征输入至预先训练好的重复音频检测模型的检测网络之中,确定出特征分段后的多个目标候选帧;将特征分段后多个目标候选帧输入至重复音频检测模型的编码器网络之中,确定出每个特征分段对应的嵌入表征特征向量;将各个特征分段对应的嵌入表征特征向量输入至重复音频检测模型的瓶颈网络之中,进行相似度计算,确定出待检测语音是否存在重复音频,若存在,则确定出重复音频的音频位置信息,提升了语音复制检测定位的检测速度以及准确性。

    一种基于自监督学习的语音鉴伪方法、装置及存储介质

    公开(公告)号:CN115662441A

    公开(公告)日:2023-01-31

    申请号:CN202211701458.0

    申请日:2022-12-29

    发明人: 郑榕 孟凡芹

    摘要: 本申请提供了一种基于自监督学习的语音鉴伪方法、装置及存储介质,语音鉴伪方法包括:将待鉴伪语音输入至语音鉴伪模型的波形增强网络层之中,对待鉴伪语音进行波形增强处理,确定出波形增强后的待鉴伪语音;将波形增强后的待鉴伪语音输入至语音鉴伪模型的自监督学习前端网络层之中,确定出波形增强后的待鉴伪语音的每一语音片段的语音特征向量;将该语音片段的多个语音特征向量输入至语音鉴伪模型的自监督学习处理网络层之中,确定出该语音片段的目标特征向量;将多个目标特征向量输入至语音鉴伪模型的鉴伪网络层之中,进行鉴伪处理,确定出待鉴伪语音是否为虚假语音。实现了为鉴伪网络层提供了有效语音表征信息,从而提高了语音鉴伪的准确率。

    一种语音合成类型的确定方法、装置、设备以及存储介质

    公开(公告)号:CN114519996B

    公开(公告)日:2022-07-08

    申请号:CN202210413157.1

    申请日:2022-04-20

    发明人: 郑榕 孟凡芹

    IPC分类号: G10L13/00 G10L15/02 G10L25/51

    摘要: 本公开提供了一种语音合成类型的确定方法、装置、设备以及存储介质,其中,该方法包括:获取待识别的目标语音,从目标语音中提取出各帧语音分别对应的目标幅度谱和目标相位谱,针对目标语音中任一帧语音的目标幅度谱和目标相位谱进行特征向量特征拼接,得到各帧语音的中间组合谱,将各帧语音对应的中间组合谱按照各帧语音的时间顺序进行拼接,得到目标语音的目标组合谱,将目标组合谱输入到用于进行语音合成类型识别的目标模型中,确定目标语音的合成类型。这样,可以提升确定语音合成类型的准确率。

    一种拼接语音的鉴别方法、装置、电子设备及存储介质

    公开(公告)号:CN113516969B

    公开(公告)日:2021-12-14

    申请号:CN202111072051.1

    申请日:2021-09-14

    发明人: 孟凡芹 郑榕 邓菁

    摘要: 本申请提供了一种拼接语音的鉴别方法、装置、电子设备及存储介质,将获取到的待鉴别语音裁剪为多个待鉴别语音段;通过待鉴别语音段融合语音特征和拼接语音鉴别模型中,确定每个待鉴别语音段的语音段类型;对待鉴别语音进行平滑处理,确定是否为拼接语音,当为拼接语音时,基于包括的目标合并拼接语音段的数量,以及每个目标合并拼接语音段在待鉴别语音中的相对位置,确定拼接语音的语音拼接点数量以及语音拼接位置。这样,本申请基于对待鉴别语音段的融合语音特征进行识别,以及通过平滑处理确定待鉴别语音是否为拼接语音,并通过平滑处理后确定出的目标合并拼接语音段确定拼接语音的拼接点数量以及拼接位置,从而提高语音鉴别的准确度和精细度。

    一种标注图像处理方法及装置
    5.
    发明公开

    公开(公告)号:CN111402120A

    公开(公告)日:2020-07-10

    申请号:CN202010198455.4

    申请日:2020-03-19

    IPC分类号: G06T3/00 G06F21/60 H04L29/06

    摘要: 本申请提供一种标注图像处理方法及装置,其中,标注图像处理方法应用于服务器,服务器与客户端之间采用加密协议进行通信,包括:接收客户端发送的获取待标注图像的请求;向客户端发送待标注图像;其中,待标注图像为与待标注的原始图像对应的一幅或者多幅模糊化图像;接收客户端发送的标注完成的标注信息,并将标注信息进行处理获取与原始图像对应的标注信息。因此,客户端与服务器之间采用加密协议进行通信,可以保证数据在服务器与客户端之间进行传输的安全性;此外,通过简单的对待标注图像的处理,包括模糊化处理、切分及重组处理等,在提高数据标注的安全性的基础上,降低了数据标注时安全管理的成本。

    心音信号的处理方法、装置、电子设备及可读存储介质

    公开(公告)号:CN112614503B

    公开(公告)日:2024-11-12

    申请号:CN202011475901.8

    申请日:2020-12-14

    发明人: 郑榕 孟凡芹

    IPC分类号: G10L21/0208

    摘要: 本申请提供了一种心音信号的处理方法、装置、电子设备及可读存储介质,通过对采集到的初始心音信号进行初级去噪处理,得到了去噪心音信号;按照得到的去噪心音信号对应的多个响度增益权重,增益放大去噪心音信号,得到放大后的放大心音信号,使得心音信号的每个频率的响度增益基本相同;再对放大后的放大心音信号进行去干扰处理,得到无干扰心音信号;最后,对得到的无干扰心音信号进行标注,得到可用于后续进行分析的目标心音信号,从而可以有效的滤除心音信号中的噪音,有助于减少心音信号中的干扰成分,进而,可以提高后期对心音信号进行分析时分析结果的准确性。

    一种基于自监督学习的语音鉴伪方法、装置及存储介质

    公开(公告)号:CN115662441B

    公开(公告)日:2023-03-28

    申请号:CN202211701458.0

    申请日:2022-12-29

    发明人: 郑榕 孟凡芹

    摘要: 本申请提供了一种基于自监督学习的语音鉴伪方法、装置及存储介质,语音鉴伪方法包括:将待鉴伪语音输入至语音鉴伪模型的波形增强网络层之中,对待鉴伪语音进行波形增强处理,确定出波形增强后的待鉴伪语音;将波形增强后的待鉴伪语音输入至语音鉴伪模型的自监督学习前端网络层之中,确定出波形增强后的待鉴伪语音的每一语音片段的语音特征向量;将该语音片段的多个语音特征向量输入至语音鉴伪模型的自监督学习处理网络层之中,确定出该语音片段的目标特征向量;将多个目标特征向量输入至语音鉴伪模型的鉴伪网络层之中,进行鉴伪处理,确定出待鉴伪语音是否为虚假语音。实现了为鉴伪网络层提供了有效语音表征信息,从而提高了语音鉴伪的准确率。

    一种虚假语音的识别方法、装置、电子设备及存储介质

    公开(公告)号:CN115497481B

    公开(公告)日:2023-03-03

    申请号:CN202211437338.4

    申请日:2022-11-17

    发明人: 郑榕 孟凡芹

    摘要: 本申请提供了一种虚假语音的识别方法、装置、电子设备及存储介质,包括:将声纹噪声向量输入至声纹噪声嵌入生成器中输出第一隐藏噪声嵌入向量,将鉴伪噪声向量输入至鉴伪噪声嵌入生成器中输出第二隐藏噪声嵌入向量;将待识别语音输入至声纹编码器模型之中输出声纹嵌入向量,将待识别语音输入至鉴伪编码器模型之中输出鉴伪嵌入向量;基于第一隐藏噪声嵌入向量、第二隐藏噪声嵌入向量、声纹嵌入向量以及鉴伪嵌入向量,确定出目标声纹增强向量以及目标鉴伪增强向量;将目标声纹增强向量以及目标鉴伪增强向量输入至检测模型之中,输出待识别语音是否为虚假语音。通过重构变分自动编码器对噪声嵌入分布进行估计,可以增强语音检测的准确率和效率。

    一种虚假语音的检测方法、装置、电子设备及存储介质

    公开(公告)号:CN114596879B

    公开(公告)日:2022-12-30

    申请号:CN202210297859.8

    申请日:2022-03-25

    发明人: 孟凡芹 郑榕

    IPC分类号: G10L25/51 G10L25/30 G10L25/18

    摘要: 本申请提供了一种虚假语音的检测方法、装置、电子设备及存储介质,方法包括:获取待检测语音;将待检测语音输入语音检测模型的嵌入特征提取网络层,确定出全频带语音特征和多个子频带语音特征;将全频带语音特征和多个子频带语音特征输入组合注意力网络层,确定出全频带局部特征以及多个子频带局部特征;其中,全频带局部特征和子频带局部特征均是在至少一个注意力维度上进行特征提取确定的;将全频带局部特征和多个子频带局部特征输入融合注意力网络层,确定出目标语音融合特征;基于目标语音融合特征,确定出待检测语音是否为虚假语音。通过直接将待检测语音输入语音检测模型中在不同注意力维度上进行全频带和子频带的语音特征提取,从而可以提高对虚假语音识别的准确率。

    一种拼接语音的鉴别方法、装置、电子设备及存储介质

    公开(公告)号:CN113516969A

    公开(公告)日:2021-10-19

    申请号:CN202111072051.1

    申请日:2021-09-14

    发明人: 孟凡芹 郑榕 邓菁

    摘要: 本申请提供了一种拼接语音的鉴别方法、装置、电子设备及存储介质,将获取到的待鉴别语音裁剪为多个待鉴别语音段;通过待鉴别语音段融合语音特征和拼接语音鉴别模型中,确定每个待鉴别语音段的语音段类型;对待鉴别语音进行平滑处理,确定是否为拼接语音,当为拼接语音时,基于包括的目标合并拼接语音段的数量,以及每个目标合并拼接语音段在待鉴别语音中的相对位置,确定拼接语音的语音拼接点数量以及语音拼接位置。这样,本申请基于对待鉴别语音段的融合语音特征进行识别,以及通过平滑处理确定待鉴别语音是否为拼接语音,并通过平滑处理后确定出的目标合并拼接语音段确定拼接语音的拼接点数量以及拼接位置,从而提高语音鉴别的准确度和精细度。