-
公开(公告)号:CN117877129A
公开(公告)日:2024-04-12
申请号:CN202311813132.1
申请日:2023-12-26
Applicant: 浙江大学杭州国际科创中心
Abstract: 本发明公开一种基于信息瓶颈的深度伪造图像检测方法、系统及装置,方法包括:获取真伪视频,通过预处理得到真伪图像数据集;基于初始图像真伪检测模型,对真伪图像数据集进行特征提取得到图像局部特征集及联合局部特征,建立局部损失函数;通过联合局部特征,得到图像全局特征,进而搭建全局损失函数;基于图像全局特征判定真伪,通过结果搭建类别损失函数;结合局部损失函数、全局损失函数及类别损失函数,对初始伪造图像检测模型进行优化更新,得到图像真伪检测模型;将待检测图像输入图像真伪检测模型中,得到图像真伪检测结果。通过本发明的方法得到更加全面的伪造特征,解决现有伪造图像检测模型的准确度不足及泛化性不强的问题。
-
公开(公告)号:CN117877501A
公开(公告)日:2024-04-12
申请号:CN202311818377.3
申请日:2023-12-27
Applicant: 浙江大学杭州国际科创中心
IPC: G10L21/0208 , G10L25/30 , G10L17/18
Abstract: 本发明公开了一种基于神经网络的语音干扰噪声授权消除方法,包括以下步骤:步骤1、获取语音数据集;步骤2、收集多种不同形式的语音噪声数据;步骤3、在噪声数据中引入随机时间偏移;步骤4、在噪声数据中引入随机冲激响应特征;步骤5、在收集语音数据上添加噪声数据集中的噪声;步骤6、训练和使用噪声消除神经网络模型。本发明提供的方法能够实现授权定向清除不同形式的干扰噪音,以获得高质量的语音数据。
-
公开(公告)号:CN117633899A
公开(公告)日:2024-03-01
申请号:CN202311825793.6
申请日:2023-12-27
Applicant: 浙江大学杭州国际科创中心
Abstract: 本发明公开一种基于掩码的人脸图像生成模型隐私保护方法、系统及装置,方法包括:获取原始人脸数据集并进行预处理得到裁剪对齐图片;基于所述裁剪对齐图片,得到通用的人脸特征重要性热力图;进行归一化处理,得到归一化特征重要性数值;基于归一化特征重要性数值将原始人脸图像分割为图像块,得到人脸关键部分并基于人脸关键部分代替原始人脸数据集中相同部位,得到训练数据集;对训练数据集中每张图片加入随机噪声,进而得到训练损失结果;根据训练损失结果进行参数优化及更新,得到深度伪造人脸生成预训练模型;对深度伪造人脸生成预训练模型进行训练微调,得到深度伪造人脸生成模型。本发明能有效的保护人脸数据集隐私,减少人脸数据泄露。
-
公开(公告)号:CN115841821A
公开(公告)日:2023-03-24
申请号:CN202211427811.0
申请日:2022-11-15
Applicant: 浙江大学杭州国际科创中心
Abstract: 本发明公开了一种基于人类语音结构的语音干扰噪声设计方法,包括如下步骤:(1)获取大量包含不同说话人、不同说话内容的语音数据,进行声纹信息提取后构建初始语音数据集;(2)对于每个用户,获取少量的用户语音数据,进行声纹信息提取后在初始语音数据集中匹配最为接近的语音数据;(3)对匹配得到的语音数据进行数据增广;(4)利用音素切割算法对增广后的语音数据进行切分,构成元音数据集和辅音数据集;(5)基于元音数据集和辅音数据集构建三段噪声序列,叠加后得到干扰噪声;(6)持续生成随机干扰噪声并播放,持续的干扰噪声注入录音中实现连续干扰。利用本发明,可以使干扰噪声无法从语音中去除,从而避免用户隐私信息的泄漏。
-
-
-