用于隐私数据的大模型训练样本构建和学生模型训练方法

    公开(公告)号:CN119322945A

    公开(公告)日:2025-01-17

    申请号:CN202411635346.9

    申请日:2024-11-15

    Abstract: 本发明涉及一种用于隐私数据的大模型训练样本构建和学生模型训练方法和系统。构建方法包括:客户端获取原始样本;客户端基于划分规则,将原始样本划分为第一子原始样本和第二子原始样本,发送至第一服务器和第二服务器;第一服务器和第二服务器基于保存的第一子教师模型和第二子教师模型,分别对第一子原始样本和第二子原始样本进行预测,对应生成并发送第一预测结果和第二预测结果至第三服务器;第三服务器基于秘密共享协议,对第一预测结果和第二预测结果进行合并,生成并发送完整预测结果至客户端;客户端根据完整预测结果得到原始样本的伪标签,将伪标签和原始样本构成含标签的训练样本。本发明降低了数据泄露的风险,提升了数据的隐私性。

Patent Agency Ranking