-
公开(公告)号:CN116597811A
公开(公告)日:2023-08-15
申请号:CN202310533603.7
申请日:2023-05-12
申请人: 浙江大学 , 浙江大学杭州国际科创中心
IPC分类号: G10L15/01 , G10L15/06 , G10L15/16 , G10L17/04 , G10L17/18 , G06F21/57 , G06N3/0455 , G06N3/0464 , G06N3/0475 , G06N3/094
摘要: 本发明公开了一种基于房间脉冲响应的语音后门验证方法,包括:获取目标语音模型的干净语音样本和其所在物理空间的属性信息;根据属性信息设定声学参数,并根据声学参数构建房间脉冲响应的条件向量;将条件向量与随机采样的隐向量拼接后输入房间脉冲响应生成器,合成房间脉冲响应信号作为动态触发器;使用动态触发器对干净语音样本进行投毒作为毒化语音样本,利用毒化语音样本和干净语音样本对目标语音模型进行训练,使得目标语音模型被受到感染并被注入后门;将受感染的目标语音模型部署后,正常说话发出语音以触发后门,从而验证目标语音模型的后门脆弱性,该方法有效提升语音后门的隐蔽性和鲁棒性,从而提供真实可靠的后门攻击测试。
-
公开(公告)号:CN116260619A
公开(公告)日:2023-06-13
申请号:CN202211674524.X
申请日:2022-12-26
申请人: 浙江大学 , 浙江大学杭州国际科创中心
摘要: 本发明公开了一种针对链接攻击与伪造攻击的相机指纹隐私保护方法,包括通过高斯分布采样得到至少三个子模糊噪声,获得一张待模糊处理的图片,通过根据子模糊噪声数量生成对应数量子模糊噪声系数以及噪声掩码(由0或1组成的矩阵),并且通过子模糊噪声系数以及噪声掩码将所有子模糊噪声组合成一个模糊噪声等步骤,本发明实现了在不影响合法用户正常通过基于相机指纹的身份认证系统的前提下,同时解决了链接攻击与伪造攻击两大安全隐患,可以帮助用户有效地防御身份链接攻击,速度上远远快于多次迭代去噪,实现稳定的相机指纹伪造攻击检测,避免不法分子窃取合法用户相机指纹用以通过身份认证系统。
-
公开(公告)号:CN116798441A
公开(公告)日:2023-09-22
申请号:CN202310608250.2
申请日:2023-05-26
申请人: 浙江大学 , 浙江大学杭州国际科创中心
IPC分类号: G10L21/013 , G10L25/18 , G10L25/30 , H04N21/2187
摘要: 本发明公开了一种虚拟直播环境下的实时语音转换方法和装置,高度保留了扮演者的语气、语调等身份无关的语音特征,为用户提供了无需注册、重训练即可在个人电脑上流畅运行的服务。此外,该方法提供20种以上的虚拟音色以供选择、切换,为VTuber提供更加多元化、个性化的虚拟角色扮演效果,更好地服务虚拟直播场景。本方法可以实现低延迟和高质量的实时语音生成,能够实现实时转换并控制实时延迟仅为70.8ms,在语音质量和易懂度上与最先进的基于Diffusion的多目标语音转换方法相当,在语音相似性上领先于目前的主流方法。
-
公开(公告)号:CN115631757A
公开(公告)日:2023-01-20
申请号:CN202211283900.2
申请日:2022-10-20
申请人: 浙江大学 , 浙江大学杭州国际科创中心
IPC分类号: G10L19/008 , G10L19/018 , G10L19/16
摘要: 本发明公开了一种面向语音身份匿名的卷积性对抗样本构造方法及装置,获得用户的原始语音样本,获得至少1个真实房间脉冲响应信号,通过获得的真实房间脉冲响应信号初始化卷积性对抗扰动,将获得的用户原始语音样本与卷积性对抗扰动进行卷积运算,得到初始的语音对抗样本,随机选择目标类别的标签,通过嵌入码级别的条件变分自编码器采样说话人嵌入码等步骤,本发明设计卷积性对抗扰动来近似真实自然的房间脉冲响应,能够有效减少扰动注入带来的信号失真,保证文本内容的完整性和声纹的一致性以及良好的音频感知质量,实现语音服务隐私和功用的平衡,提出的卷积性对抗扰动能够有效抵御常见的基于信号处理技术的对抗扰动破坏手段。
-
公开(公告)号:CN117877129A
公开(公告)日:2024-04-12
申请号:CN202311813132.1
申请日:2023-12-26
申请人: 浙江大学杭州国际科创中心
摘要: 本发明公开一种基于信息瓶颈的深度伪造图像检测方法、系统及装置,方法包括:获取真伪视频,通过预处理得到真伪图像数据集;基于初始图像真伪检测模型,对真伪图像数据集进行特征提取得到图像局部特征集及联合局部特征,建立局部损失函数;通过联合局部特征,得到图像全局特征,进而搭建全局损失函数;基于图像全局特征判定真伪,通过结果搭建类别损失函数;结合局部损失函数、全局损失函数及类别损失函数,对初始伪造图像检测模型进行优化更新,得到图像真伪检测模型;将待检测图像输入图像真伪检测模型中,得到图像真伪检测结果。通过本发明的方法得到更加全面的伪造特征,解决现有伪造图像检测模型的准确度不足及泛化性不强的问题。
-
公开(公告)号:CN117554716A
公开(公告)日:2024-02-13
申请号:CN202311301832.2
申请日:2023-10-07
申请人: 浙江大学杭州国际科创中心
摘要: 本申请涉及一种电子设备检测方法、装置、计算机设备和存储介质。所述方法包括:获取待检测的多个频域信息;基于待检测的多个频域信息,筛选符合电磁泄漏信号的频域特征的电磁泄漏频点;对电磁泄漏频点进行时域采集以及幅度解调,得到待定信号;确定待定信号的波形,若待定信号的波形为预设波形,则将待定信号对应的电磁泄漏频点确定为目标电子设备的频点。采用本申请的方法,可以提高电子设备检测的准确性,和电子设备检测方法的实用性。
-
公开(公告)号:CN116312548A
公开(公告)日:2023-06-23
申请号:CN202310123820.9
申请日:2023-02-16
申请人: 浙江大学杭州国际科创中心
摘要: 本发明公开了一种对说话人识别系统对抗样本的通用检测系统,包括包括多通道音频干扰模块,用于对输入的原始音频进行音频干扰,生成与原始音频对应的音频变种集合;说话人系统识别模块,用于将生成的音频变种集合输入至说话人识别系统中,提取音频变种集合对应的得分序列和判别结果序列;稳定性特征提取模块,用于对获得的得分序列和判别结果序列进行统计数特征提取,并将提取获得的特征值与得分序列进行联接,获得稳定性表示特征;单类别判别模块,根据稳定性表示特征,对输入的原始音频是否为对抗样本进行判断。本发明还公开了一种通用检测方法。本发明提供的系统可以可自适应多种情况下的对抗样本攻击检测,从而强化语音识别的安全性。
-
公开(公告)号:CN117892340A
公开(公告)日:2024-04-16
申请号:CN202311835568.0
申请日:2023-12-27
申请人: 浙江大学杭州国际科创中心
摘要: 本发明公开一种基于特征一致性的联邦学习攻击检测方法、系统及装置,方法包括:基于提取符号向量、排序向量、分类器向量及特征提取器向量;进行局部一致性检测,得到局部异常分数,判断与预设局部一致性分数阈值的关系,得到客户端局部检测结果;进行任务一致性检测,得到任务相似性分数,判断与预设任务一致性条件的关系,得到客户端任务检测结果;获取特征提取器向量的数据一致性,判断数据域距离与预设数据一致性条件的关系,得到客户端数据检测结果;剔除恶意客户端,通过良性客户端对客户端梯度更新进行分析处理。本发明方法对梯度更新特征进行分析,解决了现有联邦学习攻击检测方法中检测种类单一且联邦学习所得全局模型准确性降低的问题。
-
公开(公告)号:CN116935887A
公开(公告)日:2023-10-24
申请号:CN202310772789.1
申请日:2023-06-28
申请人: 浙江大学杭州国际科创中心
IPC分类号: G10L25/30 , G10L25/51 , G10L15/02 , G10L15/06 , G10L15/183 , G10L21/0264 , G10L21/0208
摘要: 本发明公开了一种基于时空特征注意力模型的伪造音频检测方法及装置,包括以下步骤:(1)构建一个基于时空特征注意力的检测模型;(2)基于已有的只包含平稳音频的英文公开数据集,对检测模型进行预训练;(3)混合中文音频数据集和英文音频数据集,同时引入不同音频信号失真手段,得到跨语言模态的复杂音频数据集;(4)对复杂音频数据集进行数据增强;(5)利用数据增强后的复杂音频数据集对预训练后的检测模型进行重新训练,通过将检测模型的能力迁移训练到复杂音频,得到最终检测模型;(6)将待检测的音频输入到最终检测模型,得到是否为伪造音频的检测结果。本发明能够在跨语言模态和存在信道扰动的情况下将伪造音频精准检测。
-
公开(公告)号:CN117877501A
公开(公告)日:2024-04-12
申请号:CN202311818377.3
申请日:2023-12-27
申请人: 浙江大学杭州国际科创中心
IPC分类号: G10L21/0208 , G10L25/30 , G10L17/18
摘要: 本发明公开了一种基于神经网络的语音干扰噪声授权消除方法,包括以下步骤:步骤1、获取语音数据集;步骤2、收集多种不同形式的语音噪声数据;步骤3、在噪声数据中引入随机时间偏移;步骤4、在噪声数据中引入随机冲激响应特征;步骤5、在收集语音数据上添加噪声数据集中的噪声;步骤6、训练和使用噪声消除神经网络模型。本发明提供的方法能够实现授权定向清除不同形式的干扰噪音,以获得高质量的语音数据。
-
-
-
-
-
-
-
-
-