-
公开(公告)号:CN118171076B
公开(公告)日:2024-09-06
申请号:CN202410591472.2
申请日:2024-05-14
申请人: 中国矿业大学
IPC分类号: G06F18/21 , G06F18/2321 , G06N3/0499 , G06N20/00 , G06F21/62
摘要: 本发明公开了一种数据特征提取方法、系统及计算机设备,涉及特征提取技术领域。本发明的方法包括如下步骤:获取多个客户端的隐私样本数据集;将多个隐私样本数据集分别输入深度神经网络中进行特征提取,得到多个特征数据集;根据多个特征数据集的特征点建立第一距离矩阵,对第一距离矩阵进行聚类,得到每个客户端的隐私样本数据集的聚类中心;将多个客户端的聚类中心发送至模型构建端,根据多个客户端的聚类中心构建第二距离矩阵,并对第二距离矩阵进行再聚类,得到隐私数据特征。本发明能够在客户端隐私保护的前提下刻画隐私数据的统计特性,改善联邦学习对异构数据的训练效果;且实现多领域、多模态的知识共享,提高了模型性能。
-
公开(公告)号:CN118171076A
公开(公告)日:2024-06-11
申请号:CN202410591472.2
申请日:2024-05-14
申请人: 中国矿业大学
IPC分类号: G06F18/21 , G06F18/2321 , G06N3/0499 , G06N20/00 , G06F21/62
摘要: 本发明公开了一种数据特征提取方法、系统及计算机设备,涉及特征提取技术领域。本发明的方法包括如下步骤:获取多个客户端的隐私样本数据集;将多个隐私样本数据集分别输入深度神经网络中进行特征提取,得到多个特征数据集;根据多个特征数据集的特征点建立第一距离矩阵,对第一距离矩阵进行聚类,得到每个客户端的隐私样本数据集的聚类中心;将多个客户端的聚类中心发送至模型构建端,根据多个客户端的聚类中心构建第二距离矩阵,并对第二距离矩阵进行再聚类,得到隐私数据特征。本发明能够在客户端隐私保护的前提下刻画隐私数据的统计特性,改善联邦学习对异构数据的训练效果;且实现多领域、多模态的知识共享,提高了模型性能。
-