-
公开(公告)号:CN118013031A
公开(公告)日:2024-05-10
申请号:CN202311814970.0
申请日:2023-12-26
Applicant: 浙江大学杭州国际科创中心
IPC: G06F16/35 , G06F16/33 , G06F18/241 , G06F18/214 , G06F40/30
Abstract: 本申请涉及一种提示词的确定方法、装置、计算机设备以及存储介质。所述方法包括:根据语料数据集确定验证数据集,根据验证数据集建立目标逻辑分类器;根据验证数据集确定目标标签词语,并通过目标逻辑分类器对目标标签词语进行筛选,确定目标标签词语;根据目标标签词语对语料数据集进行更新,确定更新数据集,并根据更新数据集确定训练数据集;根据训练数据集,通过大语言模型确定语料数据集的目标提示词。上述方案,提高了目标提示词的精确度,能够通过优化提示词使大语言模型自适应到下游任务,从而避免调优大语言模型所有参数,提高了提示词的自主优化效率。
-
公开(公告)号:CN118797488A
公开(公告)日:2024-10-18
申请号:CN202411281741.1
申请日:2024-09-13
Applicant: 浙江大学
IPC: G06F18/243 , G06F18/2433 , G06Q30/0601
Abstract: 本发明公开了一种多用户端联合作弊识别方法及装置,该方法包括:获取各订单的服务者和被服务者从登录到履约完成环节的行为信息、订单和支付信息,从其中提取订单特征;基于每个订单的订单特征和作弊可能性构建训练集和测试集,利用训练集对作弊识别模型进行训练,其中作弊识别模型采用LightGBM模型;基于训练后的作弊识别模型,预测测试集中各订单的作弊概率,从而得到作弊概率有效区间;将作弊概率有效区间与预定的规则组进行结合,得到全局最优的组合方式;获取待识别订单,基于全局最优的组合方式,进行待识别订单的作弊识别。通过模型嵌入原规则体系的方式来筛选出全局最优的组合方法,可以较好的提升作弊识别的精准度和召回率。
-
公开(公告)号:CN118779758B
公开(公告)日:2025-03-07
申请号:CN202411281791.X
申请日:2024-09-13
Applicant: 浙江大学
IPC: G06F18/2415 , G06F18/213 , G06F18/25 , G06F21/10
Abstract: 本发明公开了一种基于有监督模型的非法请求行为识别方法及装置,该方法包括:获取待识别订单信息,包括用户从登录到支付所有环节的埋点信息、订单行为信息、IP及设备数据;对订单信息进行预处理并提取特征,得到订单特征;基于订单特征,利用预训练的非法请求行为识别模型预测待识别订单的非法请求概率,其中非法请求识别模型通过XGBoost方法构建;基于待识别订单的非法请求概率,结合预定的非法请求行为判断规则,通过投票法进行待识别订单的非法请求行为识别。引入XGBoost识别模型,结合专家经验形成的多项识别规则,进而形成基于投票法的模型与规则交叉应用的风险识别体系,可以有效从而实现对每一次请求的识别判断。
-
公开(公告)号:CN118797488B
公开(公告)日:2025-02-07
申请号:CN202411281741.1
申请日:2024-09-13
Applicant: 浙江大学
IPC: G06F18/243 , G06F18/2433 , G06Q30/0601
Abstract: 本发明公开了一种多用户端联合作弊识别方法及装置,该方法包括:获取各订单的服务者和被服务者从登录到履约完成环节的行为信息、订单和支付信息,从其中提取订单特征;基于每个订单的订单特征和作弊可能性构建训练集和测试集,利用训练集对作弊识别模型进行训练,其中作弊识别模型采用LightGBM模型;基于训练后的作弊识别模型,预测测试集中各订单的作弊概率,从而得到作弊概率有效区间;将作弊概率有效区间与预定的规则组进行结合,得到全局最优的组合方式;获取待识别订单,基于全局最优的组合方式,进行待识别订单的作弊识别。通过模型嵌入原规则体系的方式来筛选出全局最优的组合方法,可以较好的提升作弊识别的精准度和召回率。
-
公开(公告)号:CN118779758A
公开(公告)日:2024-10-15
申请号:CN202411281791.X
申请日:2024-09-13
Applicant: 浙江大学
IPC: G06F18/2415 , G06F18/213 , G06F18/25 , G06F21/10
Abstract: 本发明公开了一种基于有监督模型的非法请求行为识别方法及装置,该方法包括:获取待识别订单信息,包括用户从登录到支付所有环节的埋点信息、订单行为信息、IP及设备数据;对订单信息进行预处理并提取特征,得到订单特征;基于订单特征,利用预训练的非法请求行为识别模型预测待识别订单的非法请求概率,其中非法请求识别模型通过XGBoost方法构建;基于待识别订单的非法请求概率,结合预定的非法请求行为判断规则,通过投票法进行待识别订单的非法请求行为识别。引入XGBoost识别模型,结合专家经验形成的多项识别规则,进而形成基于投票法的模型与规则交叉应用的风险识别体系,可以有效从而实现对每一次请求的识别判断。
-
公开(公告)号:CN117787264A
公开(公告)日:2024-03-29
申请号:CN202311744252.0
申请日:2023-12-18
Applicant: 浙江大学
IPC: G06F40/279 , G06F40/216 , G06F18/21 , G06F16/35 , G06F18/214 , G06N3/0464 , G06N3/09
Abstract: 本发明公开了一种大模型提示词版权验证方法及装置,该方法是通过利用双层优化的提示词水印注入与验证方法。在提示水印注入阶段,同步训练提示词任务与提示词水印注入任务,确保在不对大模型提示词的原有指令功能造成影响的前提下完成水印注入;在提示词水印验证阶段,通过构建假设检验模型,对所提取的信号单词分布进行分析,从而实现提示词水印的验证,以保障提示词的版权。
-
公开(公告)号:CN117115866B
公开(公告)日:2025-04-25
申请号:CN202311144816.7
申请日:2023-09-05
Applicant: 浙江大学
IPC: G06V40/12 , G06V10/774 , G06V10/764 , G06V10/77 , G06V10/82
Abstract: 本发明公开了一种深度神经网络模型指纹鲁棒性评估方法,包括:模拟攻击者获取目标模型Fv和用于微调的替代数据集Dsub;基于min‑max的双层优化算法,逆向出所述目标模型Fv的前面l层和logistic层,分别添加行为模式扰动,得到逆向后的前面l层的输出z1和logistic层的输出z2,并基于所述逆向后的前面l层的输出z1和logistic层的输出z2进行模型调优,得到替代模型Fs;根据所述目标模型和替代模型,定量和定性评估深度神经网络指纹清除的代价,并输出深度神经网络指纹鲁棒性评分。
-
公开(公告)号:CN117115866A
公开(公告)日:2023-11-24
申请号:CN202311144816.7
申请日:2023-09-05
Applicant: 浙江大学
IPC: G06V40/12 , G06V10/774 , G06V10/764 , G06V10/77 , G06V10/82
Abstract: 本发明公开了一种深度神经网络模型指纹鲁棒性评估方法,包括:模拟攻击者获取目标模型Fv和用于微调的替代数据集Dsub;基于min‑max的双层优化算法,逆向出所述目标模型Fv的前面l层和logistic层,分别添加行为模式扰动,得到逆向后的前面l层的输出z1和logistic层的输出z2,并基于所述逆向后的前面l层的输出z1和logistic层的输出z2进行模型调优,得到替代模型Fs;根据所述目标模型和替代模型,定量和定性评估深度神经网络指纹清除的代价,并输出深度神经网络指纹鲁棒性评分。
-
公开(公告)号:CN114579962A
公开(公告)日:2022-06-03
申请号:CN202210137681.0
申请日:2022-02-15
Applicant: 浙江大学
IPC: G06F21/55 , G06F16/28 , G06F16/215
Abstract: 本发明公开了一种AI安全攻防测试方法,包括:软硬件协同安全测试流程和全周期自动化安全测试方法。本发明针对大规模、复杂AI系统难以进行全面的安全性检测,当前安全测试方法功能单一、通用性差的缺陷,总结AI系统生命周期的步骤,通过全周期的自动化适配安全测试的方法分析其各个环节存在的攻击方法与对应的防御策略并构建安全测试流程,支持AI系统在实际部署环境中的全面安全防御。
-
公开(公告)号:CN115859102A
公开(公告)日:2023-03-28
申请号:CN202211524887.5
申请日:2022-11-30
Applicant: 浙江大学嘉兴研究院
IPC: G06F18/214 , G06N3/08 , G06N3/0464
Abstract: 本发明公开了一种基于特征失真指数的模型窃取防御方法及装置,该方法包括:从目标DNN模型中选择每个类别预测置信度最高的K个数据作为锚定样本;计算每个待检测样本和锚定样本之间的特征空间距离以得到特征失真指数;利用所述特征失真指数训练模型窃取攻击检测器;将训练后的模型窃取攻击检测器布置到MLaaS中,以进行模型窃取防御。本申请针对攻击者为了从MLaaS平台的目标DNN模型中获取更多模型信息,通常需要探索大量的输入空间以增加窃取查询的多样性,来训练准确率更高的替代模型,因此攻击者的查询在特征层输出上的分布偏离良性的训练样本特征的这一现象,提出一种衡量被检测样本特征偏差的指标,即特征失真指数FDI,有效检测模型窃取攻击。
-
-
-
-
-
-
-
-
-