一种基于多域信息融合的合成语音检测方法

    公开(公告)号:CN116153336A

    公开(公告)日:2023-05-23

    申请号:CN202310415885.0

    申请日:2023-04-19

    摘要: 本申请公开了一种基于多域信息融合的合成语音检测方法,包括:提取待检测的语音信号的多域声学特征;将提取的多域声学特征输入合成语音检测模型,以完成检测,所述合成语音检测模型,基于训练语音数据集,执行训练:分解出所述训练语音数据集中语音数据的有声段部分、静音段部分以及固有模态分量,基于所述语音数据的有声段部分、静音段以及固有模态分量部分,分别提取特征,将提取到的特征级联,作为多域声学特征;将所述训练语音数据集的语音数据的多域声学特征作为所述特征融合器的输入,执行训练;训练后的各浅层分类器、深度分类器用以输出融合的识别结果。本申请实施例通过多种手段综合提升合成语音检测模型的检测能力和泛化应用能力。

    一种基于流形测度的多模型融合的语音鉴伪识别方法

    公开(公告)号:CN116705063B

    公开(公告)日:2023-10-20

    申请号:CN202310979700.9

    申请日:2023-08-07

    摘要: 本发明提出了一种基于流形测度的多模型融合的语音鉴伪识别方法,方法包括:对测试语音进行预处理;再将测试语音输入到至少两个鉴伪模型,并获取输出的与鉴伪模型数量匹配的鉴伪特征;将鉴伪特征串联后进行ONPE变换,构建得到测试语音的流形空间;度量测试语音的流形空间与预先配置的用于表征不同伪造手段的语音流形空间之间的测地线距离,作为识别相似度得分;将识别相似度得分与预先配置的判别阈值进行比对,根据比对结果确定鉴伪结果。本发明通过融合多模型的深层嵌入特征、构建不同手段伪造语音的流形空间、度量不同空间的测地线距离作为识别相似度得分,从而实现鉴伪模型泛化性能的提升、以及开集条件下的语音真伪检测及伪造手段识别。

    一种基于多域信息融合的合成语音检测方法

    公开(公告)号:CN116153336B

    公开(公告)日:2023-07-21

    申请号:CN202310415885.0

    申请日:2023-04-19

    摘要: 本申请公开了一种基于多域信息融合的合成语音检测方法,包括:提取待检测的语音信号的多域声学特征;将提取的多域声学特征输入合成语音检测模型,以完成检测,所述合成语音检测模型,基于训练语音数据集,执行训练:分解出所述训练语音数据集中语音数据的有声段部分、静音段部分以及固有模态分量,基于所述语音数据的有声段部分、静音段以及固有模态分量部分,分别提取特征,将提取到的特征级联,作为多域声学特征;将所述训练语音数据集的语音数据的多域声学特征作为所述特征融合器的输入,执行训练;训练后的各浅层分类器、深度分类器用以输出融合的识别结果。本申请实施例通过多种手段综合提升合成语音检测模型的检测能力和泛化应用能力。

    多任务导向的语音语义通信方法、装置及系统

    公开(公告)号:CN116884404B

    公开(公告)日:2023-12-15

    申请号:CN202311152322.3

    申请日:2023-09-08

    摘要: 本发明公开了一种多任务导向的语音语义通信方法、装置及系统。语音语义通信方法包括:构建语义编码器、信源信道联合编码器、信源信道联合解码器以及多种语义解码器,每种语义解码器对应处理一种语音通信任务;基于语义编码器,从待通信语音信源中提取出多任务通用语义特征;基于信源信道联合编码器,对多任务通用语义特征进行信道编码并通过信道传输至信源信道联合解码器;信源信道联合解码器对完成信道编码的多任务通用语义特征进行信道解码,以获得已解码语义特征;根据目标语音通信任务从多种语义解码器中选择相应的语义解码器,以对(56)对比文件Tianxiao Han 等.Semantic-PreservedCommunication System for Highly EfficientSpeech Transmission《.IEEE Journal onSelected Areas in Communications 》.2022,全文.Zhenzi Weng 等.Deep Learning EnabledSemantic Communications With SpeechRecognition and Synthesis《. IEEETransactions on Wireless Communications》.2023,全文.Zhenzi Weng 等.Semantic communicationsystems for speech transmission 《. IEEEJournal on Selected Areas inCommunications 》.2021,全文.

    一种基于流形测度的多模型融合的语音鉴伪识别方法

    公开(公告)号:CN116705063A

    公开(公告)日:2023-09-05

    申请号:CN202310979700.9

    申请日:2023-08-07

    摘要: 本发明提出了一种基于流形测度的多模型融合的语音鉴伪识别方法,方法包括:对测试语音进行预处理;再将测试语音输入到至少两个鉴伪模型,并获取输出的与鉴伪模型数量匹配的鉴伪特征;将鉴伪特征串联后进行ONPE变换,构建得到测试语音的流形空间;度量测试语音的流形空间与预先配置的用于表征不同伪造手段的语音流形空间之间的测地线距离,作为识别相似度得分;将识别相似度得分与预先配置的判别阈值进行比对,根据比对结果确定鉴伪结果。本发明通过融合多模型的深层嵌入特征、构建不同手段伪造语音的流形空间、度量不同空间的测地线距离作为识别相似度得分,从而实现鉴伪模型泛化性能的提升、以及开集条件下的语音真伪检测及伪造手段识别。

    合成语音溯源取证方法及装置、电子设备及存储介质

    公开(公告)号:CN116153337B

    公开(公告)日:2023-07-21

    申请号:CN202310423246.9

    申请日:2023-04-20

    IPC分类号: G10L25/51 G10L25/30

    摘要: 本发明提出了一种合成语音溯源取证方法及装置、电子设备及存储介质,方法包括:S1,对待测试语音进行采样率规整处理;S2,对规整后的测试语音提取至少两种不同的、多时频分辨率的声学特征;S3,基于预先训练好的合成语音溯源取证模型,从每种声学特征中提取语音生成手段的鉴别特征,基于得到的多种鉴别特征获得融合特征,对融合特征进行核零Foley ‑Sammon变换得到零空间映射特征,基于零空间映射特征识别出待测试语音的生成手段;S4,将识别出的待测试语音的生成手段作为溯源取证结果。本发明不仅可以实现对训练阶段已知生成手段的精准溯源,还可以实现对未知生成手段的自主认知以及溯源模型的增量式学习,弥补了当前闭集溯源方法的不足。

    合成语音溯源取证方法及装置、电子设备及存储介质

    公开(公告)号:CN116153337A

    公开(公告)日:2023-05-23

    申请号:CN202310423246.9

    申请日:2023-04-20

    IPC分类号: G10L25/51 G10L25/30

    摘要: 本发明提出了一种合成语音溯源取证方法及装置、电子设备及存储介质,方法包括:S1,对待测试语音进行采样率规整处理;S2,对规整后的测试语音提取至少两种不同的、多时频分辨率的声学特征;S3,基于预先训练好的合成语音溯源取证模型,从每种声学特征中提取语音生成手段的鉴别特征,基于得到的多种鉴别特征获得融合特征,对融合特征进行核零Foley‑Sammon变换得到零空间映射特征,基于零空间映射特征识别出待测试语音的生成手段;S4,将识别出的待测试语音的生成手段作为溯源取证结果。本发明不仅可以实现对训练阶段已知生成手段的精准溯源,还可以实现对未知生成手段的自主认知以及溯源模型的增量式学习,弥补了当前闭集溯源方法的不足。