-
公开(公告)号:CN117877129A
公开(公告)日:2024-04-12
申请号:CN202311813132.1
申请日:2023-12-26
Applicant: 浙江大学杭州国际科创中心
Abstract: 本发明公开一种基于信息瓶颈的深度伪造图像检测方法、系统及装置,方法包括:获取真伪视频,通过预处理得到真伪图像数据集;基于初始图像真伪检测模型,对真伪图像数据集进行特征提取得到图像局部特征集及联合局部特征,建立局部损失函数;通过联合局部特征,得到图像全局特征,进而搭建全局损失函数;基于图像全局特征判定真伪,通过结果搭建类别损失函数;结合局部损失函数、全局损失函数及类别损失函数,对初始伪造图像检测模型进行优化更新,得到图像真伪检测模型;将待检测图像输入图像真伪检测模型中,得到图像真伪检测结果。通过本发明的方法得到更加全面的伪造特征,解决现有伪造图像检测模型的准确度不足及泛化性不强的问题。
-
公开(公告)号:CN118247844A
公开(公告)日:2024-06-25
申请号:CN202410335896.2
申请日:2024-03-22
Applicant: 浙江大学杭州国际科创中心
Abstract: 本发明公开一种基于扩散模型及注意力机制的动物姿态估计方法、系统及装置,方法包括:获取动物姿态视频,进而得到动物姿态图像进行关键点标注,得到姿态估计数据集;基于姿态估计数据集进行特征提取,结合姿态图像特征图及姿态支持特征图得到姿态掩码特征图集;基于关键点得到真实姿态热图集,结合真实姿态热图集及姿态掩码特征集,得到预测姿态热图集及预测关键点数据;构建姿态特征提取预训练模型及关键点预测预训练模型,搭建姿态约束损失函数,训练得到姿态掩码提取模型及关键点预测模型;进而对待测姿态估计图像进行预测,得到动物姿态数据。本发明方法解决了现有姿态估计方法对于遮挡及复杂姿态场景下,准确率及鲁棒性较低的问题。
-
公开(公告)号:CN118447536A
公开(公告)日:2024-08-06
申请号:CN202410575937.5
申请日:2024-05-10
Applicant: 浙江大学杭州国际科创中心
IPC: G06V40/10 , G06V10/44 , G06V10/34 , G06V10/82 , G06N3/0455 , G06N3/0464 , G06N3/048 , G06N3/084 , G06V10/80
Abstract: 本发明公开了一种基于Transformer及扩散模型的人体姿态估计方法、系统和装置,方法包括:获取人体姿态估计数据集;对姿态目标帧及姿态支持帧特征提取得到目标帧姿态特征图和支持帧姿态特征图;构建基于Transformer架构的姿态估计模型,用目标帧姿态特征图、支持帧姿态特征图及关键点数据生成支持帧姿态热图集和真实姿态热图集,并基于姿态支持热图集生成预测姿态热图集;构建基于扩散模型的人体姿态特征提取训练模型并进行训练得到人体姿态特征提取模型;通过人体姿态估计模型对测试集中的待测姿态估计图像进行预测,得到人体姿态数据。本方法同时利用了Tansformer的内容全觉性和扩散模型的推理能力来处理姿态估计中遮挡等问题,增强了模型的推理能力,避免了错误估计。
-
公开(公告)号:CN118096078A
公开(公告)日:2024-05-28
申请号:CN202410335135.7
申请日:2024-03-22
Applicant: 浙江大学杭州国际科创中心
Abstract: 本发明公开了一种基于区块链技术的食堂补贴账本管理方法、系统及装置,方法包括:获取账本信息及第一数字签名;将账本信息输入至预设审计检测模型中得到检测结果,并对检测结果进行审计,审计通过后基于双方账本信息、第一数字签名及审计时间生成用于检验的第二数字签名;基于智能合约将审计后的双方账本信息、第二数字签名、审计时间及审计公钥上传至区块链系统的记录模块中;调用智能合约查看记录模块的相应信息并进行判断是否存疑,并调用智能合约对举报信息进行反馈,进而对存疑的账本信息进行审查和处理。本方法解决了传统食堂补贴账本易被篡改进而导致的一系列贪污挪用等问题,以及传统账本防篡改人工审计成本高、周期长的问题。
-
公开(公告)号:CN115862670A
公开(公告)日:2023-03-28
申请号:CN202211399084.1
申请日:2022-11-09
Applicant: 浙江大学杭州国际科创中心
IPC: G10L25/18 , G10L25/51 , G10L21/0264
Abstract: 本发明公开了一种基于硬件特性的非线性注入攻击检测方法与装置,其中,检测方法包括以下步骤:(1)对采集的待测音频做语音活动检测,并将待测音频按语音部分进行切分,剔除无语音部分后得到多个语音片段;(2)对于每一个语音片段,同时进行欠采样音频检测与异常白噪声检测;若存在与常规语音部分相似的欠采样音频和/或存在与语音能量高度相关的近似白噪声,则判定该语音片段由非线性注入,并对用户发出警告。本发明中,检测方法可以直接部署于智能设备上,检测装置可以部署于智能设备附近,均可独立完成检测工作,可以为语音助手用户提供便捷、普适、无法规避的非线性注入攻击检测方案。
-
公开(公告)号:CN115841821A
公开(公告)日:2023-03-24
申请号:CN202211427811.0
申请日:2022-11-15
Applicant: 浙江大学杭州国际科创中心
Abstract: 本发明公开了一种基于人类语音结构的语音干扰噪声设计方法,包括如下步骤:(1)获取大量包含不同说话人、不同说话内容的语音数据,进行声纹信息提取后构建初始语音数据集;(2)对于每个用户,获取少量的用户语音数据,进行声纹信息提取后在初始语音数据集中匹配最为接近的语音数据;(3)对匹配得到的语音数据进行数据增广;(4)利用音素切割算法对增广后的语音数据进行切分,构成元音数据集和辅音数据集;(5)基于元音数据集和辅音数据集构建三段噪声序列,叠加后得到干扰噪声;(6)持续生成随机干扰噪声并播放,持续的干扰噪声注入录音中实现连续干扰。利用本发明,可以使干扰噪声无法从语音中去除,从而避免用户隐私信息的泄漏。