一种基于非决策域方法的模型水印方法及装置

    公开(公告)号:CN118134740A

    公开(公告)日:2024-06-04

    申请号:CN202410553090.0

    申请日:2024-05-07

    申请人: 浙江大学

    IPC分类号: G06T1/00 G06N20/00

    摘要: 本发明公开了一种基于非决策域方法的模型水印方法及装置,根据选择的待嵌入的水印#imgabs0#和水印提取密钥并使用可解释性方法定义待训练模型的损失函数,通过损失函数对待训练模型进行优化,得到优化后的模型;随后将待嵌入的水印嵌入到优化后的模型中,得到嵌入水印的模型;利用水印提取密钥通过可解释性方法从嵌入水印的模型中提取水印#imgabs1#;将提取出的水印#imgabs2#与待嵌入的水印#imgabs3#进行比对,确定版权归属。本申请针对传统基于后门的黑盒模型版权认证方法对模型有害、不包含任何信息和易被攻击者伪造的缺点,巧妙地采用非决策域方法,不影响模型的预测结果,能够有效地保护各类人工智能模型的版权,实现无害化、多比特、不易伪造的模型版权认证方案。

    一种基于非决策域方法的模型水印方法及装置

    公开(公告)号:CN118134740B

    公开(公告)日:2024-07-30

    申请号:CN202410553090.0

    申请日:2024-05-07

    申请人: 浙江大学

    IPC分类号: G06T1/00 G06N20/00

    摘要: 本发明公开了一种基于非决策域方法的模型水印方法及装置,根据选择的待嵌入的水印#imgabs0#和水印提取密钥并使用可解释性方法定义待训练模型的损失函数,通过损失函数对待训练模型进行优化,得到优化后的模型;随后将待嵌入的水印嵌入到优化后的模型中,得到嵌入水印的模型;利用水印提取密钥通过可解释性方法从嵌入水印的模型中提取水印#imgabs1#;将提取出的水印#imgabs2#与待嵌入的水印#imgabs3#进行比对,确定版权归属。本申请针对传统基于后门的黑盒模型版权认证方法对模型有害、不包含任何信息和易被攻击者伪造的缺点,巧妙地采用非决策域方法,不影响模型的预测结果,能够有效地保护各类人工智能模型的版权,实现无害化、多比特、不易伪造的模型版权认证方案。

    一种基于非决策域方法的模型指纹方法及装置

    公开(公告)号:CN118520440A

    公开(公告)日:2024-08-20

    申请号:CN202410664418.6

    申请日:2024-05-27

    申请人: 浙江大学

    摘要: 本发明公开了一种基于非决策域方法的模型指纹方法及装置,根据选择的待生成的指纹w和指纹提取密钥并使用可解释性方法定义模型F的损失函数,通过损失函数对指纹提取密钥进行优化,得到优化后的指纹提取密钥;利用优化后的指纹提取密钥通过可解释性方法从模型F中提取指纹w′,与指纹w进行比对,确定版权归属。本申请针对传统的黑盒模型指纹方法中指纹不包含任何信息和易被攻击者伪造的缺点,巧妙地采用非决策域方法,不影响模型的预测结果,能够有效地保护各类人工智能模型的版权,实现多比特和不易伪造的模型版权认证方案。

    一种基于非决策域方法的数据集版权认证方法及装置

    公开(公告)号:CN118520434A

    公开(公告)日:2024-08-20

    申请号:CN202410664413.3

    申请日:2024-05-27

    申请人: 浙江大学

    摘要: 本发明公开了一种基于非决策域方法的数据集版权认证方法及装置,根据训练数据集、测试数据集和扰动矩阵集合对辅助模型进行优化;根据待嵌入的水印w和水印提取密钥并使用可解释性方法定义优化后的辅助模型的损失函数对扰动矩阵集合进行优化,得到优化后的扰动矩阵集合;利用优化后的扰动矩阵集合将待嵌入的水印w嵌入到训练数据集,得到优化后的训练数据集;利用优化后的训练数据集对待验证模型进行训练优化,得到优化后的验证模型;利用水印提取密钥通过可解释性方法从优化后的验证模型中提取水印w′,与待嵌入的水印w进行比对,确定版权归属。本申请针对传统的基于后门的黑盒数据集版权认证方法对模型有害、不包含任何信息和易被攻击者伪造的缺点,巧妙地采用非决策域方法,在嵌入了水印的数据集上训练模型的性能不会受到影响,不影响模型的预测结果,能够有效地保护各类人工智能数据集的版权,实现无害化、多比特、不易伪造的数据集版权认证方案。