-
公开(公告)号:CN115879105A
公开(公告)日:2023-03-31
申请号:CN202110910377.0
申请日:2021-08-09
申请人: 北京大学 , 腾讯科技(深圳)有限公司
摘要: 本公开提供一种攻击防御方法、装置、电子设备和计算机可读存储介质,该攻击防御方法包括:获取属于待保护类别的待预测文本及所述待预测文本属于所述待保护类别的置信度;获取与所述待保护类别对应的类别扰动项;通过所述类别扰动项对所述待预测文本进行扰动处理,以获得待预测扰动文本;获得所述待预测扰动文本属于所述待保护类别的置信度;根据所述待预测文本属于所述待保护类别的置信度、以及所述待预测扰动文本属于所述待保护类别的置信度,确定所述待预测文本为风险文本或者无风险文本。本公开实施例可以准确的确定该待预测文本是风险文本还是无风险文本。
-
公开(公告)号:CN115374776A
公开(公告)日:2022-11-22
申请号:CN202110555056.3
申请日:2021-05-20
申请人: 北京大学 , 腾讯科技(深圳)有限公司
IPC分类号: G06F40/284 , G06F40/44 , G06K9/62
摘要: 本申请实施例公开了文本处理方法、装置、存储介质及电子设备。上述方法包括获取目标文本,上述目标文本包括预设词集合中的全部预设词;对上述目标文本进行分词处理,得到词序列;确定上述词序列中各个词对应的词向量,得到词向量信息,上述词向量信息中包括全部上述预设词对应的词向量;根据上述词向量信息进行分类处理,得到目标处理结果,上述目标处理结果指向预设类目的概率高于预设第一阈值,上述预设类目与上述预设词集合一一对应。本申请实施例可以确保只有在目标文本包括全部预设词的情况下才可以高概率触发预设响应,降低在只包括部分预设词或不包括预设词的情况下误触发预设响应的概率。
-