-
公开(公告)号:CN118013031A
公开(公告)日:2024-05-10
申请号:CN202311814970.0
申请日:2023-12-26
Applicant: 浙江大学杭州国际科创中心
IPC: G06F16/35 , G06F16/33 , G06F18/241 , G06F18/214 , G06F40/30
Abstract: 本申请涉及一种提示词的确定方法、装置、计算机设备以及存储介质。所述方法包括:根据语料数据集确定验证数据集,根据验证数据集建立目标逻辑分类器;根据验证数据集确定目标标签词语,并通过目标逻辑分类器对目标标签词语进行筛选,确定目标标签词语;根据目标标签词语对语料数据集进行更新,确定更新数据集,并根据更新数据集确定训练数据集;根据训练数据集,通过大语言模型确定语料数据集的目标提示词。上述方案,提高了目标提示词的精确度,能够通过优化提示词使大语言模型自适应到下游任务,从而避免调优大语言模型所有参数,提高了提示词的自主优化效率。
-
公开(公告)号:CN116341000A
公开(公告)日:2023-06-27
申请号:CN202310248692.0
申请日:2023-03-13
Applicant: 浙江大学
Abstract: 本发明公开了一种信息保护增强的带标签隐私集合求交方法,涉及隐私计算技术领域,该方法由数据需求方发起,并与一个数据及其标签的持有方共同执行,所述方法包括:参与双方采用椭圆曲线上的求逆迪菲赫尔曼密钥协商协议变种,加入数据乱序操作,获得匿踪后的匹配数据下标;数据需求方采用乱序操作的逆过程,还原出交集原始数据下标;双方执行不经意传输协议,数据需求方获取交集数据对应的标签。该方法能够筛选出符合某些特性的数据标签信息,而不对参与方泄露参与求交的任何数据,能够保持标签以外数据的私密性。
-
公开(公告)号:CN117725595A
公开(公告)日:2024-03-19
申请号:CN202311860164.7
申请日:2023-12-29
Applicant: 浙江大学
Abstract: 本发明公开了一种基于特征归因的软件安全模型解释方法,基于可解释人工智能中的特征归因技术,对现有的基于深度学习的软件安全模型进行更新,对已有的可解释算法进行集成,并重新定义了不同软件安全任务中的解释粒度,从而实现软件安全模型的可解释性以及其在安全分析中的实用性,可以辅助包含恶意软件分析、漏洞分析在内的不同下游安全分析任务。本发明针对黑盒的软件安全模型,首次提出了一种基于特征归因的可解释性方法,增加了模型决策的透明性,提升了模型在实际生产中的可信度,可以被用作软件安全专家分析二进制代码或源代码的工具,提供恶意代码或漏洞成因的定位和标注功能,具有实用性强以及可迁移性高等优点。
-
公开(公告)号:CN118428475A
公开(公告)日:2024-08-02
申请号:CN202410476975.5
申请日:2024-04-19
Applicant: 浙江大学
IPC: G06N5/04 , G06F18/241 , G06F18/214
Abstract: 本发明公开了一种机器学习模型推理与遗忘请求协同处理方法,机器学习在线服务提供商基于遗忘请求在后台实时更新模型,并对用户推理请求进行鲁棒性检测,依据检测结果进行服务调度,从而实现更快的响应速度。该方法包括如下步骤:1)子模型训练:拆分数据集并训练多个具备独立推理能力的子模型并上线服务;2)遗忘请求处理:基于服务期间收到的遗忘请求实时更新相应子模型;3)推理请求响应:优先响应高鲁棒性推理请求,等到模型完成更新后再基于新模型响应低鲁棒性请求。本发明首次提出了机器学习在线服务场景下多种请求的协同处理方法,在保证隐私性与正确性的同时实现了更高的响应速度,优于现有方法,具有通用性强、易于部署等优点。
-
公开(公告)号:CN117807437A
公开(公告)日:2024-04-02
申请号:CN202311825338.6
申请日:2023-12-27
Applicant: 浙江大学嘉兴研究院
IPC: G06F18/214 , G06F18/2413 , G06N3/088 , G06N3/0455 , G06F21/56
Abstract: 本发明公开了一种基于无监督学习的概念漂移缓解方法及装置,包括:通过恶意应用分类器的训练样本训练一个无监督学习的自编码器,对于待测样本,使用所述自编码器计算其与各训练样本类别中心的距离,实现漂移样本检测;对于检测出的漂移样本,利用特征归因技术,基于各个特征对于漂移检测的贡献,实现样本漂移原因的解释;选取漂移样本与解释结果进行标注,利用主动学习框架更新所述恶意应用分类器;利用更新后的恶意应用分类器进行软件的分类。通过将对训练样本的自编码拟合,实验测试样本漂移的实时检测,并且加入了一个可解释模块,利用嵌入距离计算特征贡献,极大地降低了主动学习框架中的人工标注成本。
-
公开(公告)号:CN117787264A
公开(公告)日:2024-03-29
申请号:CN202311744252.0
申请日:2023-12-18
Applicant: 浙江大学
IPC: G06F40/279 , G06F40/216 , G06F18/21 , G06F16/35 , G06F18/214 , G06N3/0464 , G06N3/09
Abstract: 本发明公开了一种大模型提示词版权验证方法及装置,该方法是通过利用双层优化的提示词水印注入与验证方法。在提示水印注入阶段,同步训练提示词任务与提示词水印注入任务,确保在不对大模型提示词的原有指令功能造成影响的前提下完成水印注入;在提示词水印验证阶段,通过构建假设检验模型,对所提取的信号单词分布进行分析,从而实现提示词水印的验证,以保障提示词的版权。
-
公开(公告)号:CN117056957A
公开(公告)日:2023-11-14
申请号:CN202310498860.1
申请日:2023-05-06
Applicant: 浙江大学
Abstract: 本发明公开了一种极小极大学习模型的可验证数据遗忘隐私保护方法和装置,该方法基于全海森曲率矩阵,对极小极大模型的参数进行牛顿步更新并添加随机扰动,进而从模型中移除所遗忘数据的影响,从而实现有效的、可验证的机器学习模型遗忘,近似达到在剩余数据上重新训练的效果。本发明首次提出了针对极小极大问题的可验证机器学习模型遗忘方法,充分利用已训练模型的参数及数据,获得通过模型遗忘机制更新后的新参数,避免了重新训练的高昂计算开销,在处理用户数据删除请求的同时,保护了数据隐私。
-
-
-
-
-
-