-
公开(公告)号:CN110222578B
公开(公告)日:2022-12-27
申请号:CN201910381832.5
申请日:2019-05-08
申请人: 腾讯科技(深圳)有限公司
IPC分类号: G06V20/70 , G06V10/774 , G06V10/82 , G06N3/04
摘要: 本公开提供了一种对抗测试看图说话系统的方法和相关装置。该方法包括:构造概率对数函数;将所述概率对数函数分解成第一函数项和第二函数项;为第二函数项指定对抗噪声,求解第二函数项最小时的非预定观测位置出现的词组合的概率,并将解出的非预定观测位置出现的词组合的概率代入第一函数项,求解第一函数项最大时的对抗噪声,反复进行迭代,直到满足迭代终止条件;将迭代后得到的对抗噪声叠加到所述看图说话系统要识别的图片上,以期望所述看图说话系统识别出的语句的预定观测位置出现指定的词。本公开实施例不但能够使看图说话系统生成的图像描述语句含有指定的词,还能够指定这些词出现的位置,即在指定的位置出现指定的词。
-
公开(公告)号:CN110188620B
公开(公告)日:2022-11-04
申请号:CN201910381831.0
申请日:2019-05-08
申请人: 腾讯科技(深圳)有限公司
IPC分类号: G06V10/70 , G06F40/216
摘要: 本公开提供了一种对抗测试看图说话系统的方法及相关装置。该方法包括:构造目标函数;对所述目标函数中具有求最大值符号的算项,指定对抗噪声,基于所述对抗噪声,确定具有求最大值符号的算项最大时算项中的未知变量值,将所述目标函数中所述具有求最大值符号的算项去最大值符号后的部分作为剩余函数,将求出的未知变量值代入所述剩余函数中求解使剩余函数值最小时的对抗噪声,替代之前指定的对抗噪声,反复迭代;将迭代终止后得到的对抗噪声叠加到所述看图说话系统要识别的图片上。本公开实施例不但能够使看图说话系统生成的图像描述语句含有指定的词,还能够指定这些词出现的位置,即在指定的位置出现指定的词。
-
公开(公告)号:CN110188620A
公开(公告)日:2019-08-30
申请号:CN201910381831.0
申请日:2019-05-08
申请人: 腾讯科技(深圳)有限公司
摘要: 本公开提供了一种对抗测试看图说话系统的方法及相关装置。该方法包括:构造目标函数;对所述目标函数中具有求最大值符号的算项,指定对抗噪声,基于所述对抗噪声,确定具有求最大值符号的算项最大时算项中的未知变量值,将所述目标函数中所述具有求最大值符号的算项去最大值符号后的部分作为剩余函数,将求出的未知变量值代入所述剩余函数中求解使剩余函数值最小时的对抗噪声,替代之前指定的对抗噪声,反复迭代;将迭代终止后得到的对抗噪声叠加到所述看图说话系统要识别的图片上。本公开实施例不但能够使看图说话系统生成的图像描述语句含有指定的词,还能够指定这些词出现的位置,即在指定的位置出现指定的词。
-
公开(公告)号:CN110222578A
公开(公告)日:2019-09-10
申请号:CN201910381832.5
申请日:2019-05-08
申请人: 腾讯科技(深圳)有限公司
摘要: 本公开提供了一种对抗测试看图说话系统的方法和相关装置。该方法包括:构造概率对数函数;将所述概率对数函数分解成第一函数项和第二函数项;为第二函数项指定对抗噪声,求解第二函数项最小时的非预定观测位置出现的词组合的概率,并将解出的非预定观测位置出现的词组合的概率代入第一函数项,求解第一函数项最大时的对抗噪声,反复进行迭代,直到满足迭代终止条件;将迭代后得到的对抗噪声叠加到所述看图说话系统要识别的图片上,以期望所述看图说话系统识别出的语句的预定观测位置出现指定的词。本公开实施例不但能够使看图说话系统生成的图像描述语句含有指定的词,还能够指定这些词出现的位置,即在指定的位置出现指定的词。
-
-
-