-
公开(公告)号:CN111695153A
公开(公告)日:2020-09-22
申请号:CN202010514315.3
申请日:2020-06-08
Applicant: 中南大学
IPC: G06F21/62
Abstract: 本申请实施例公开了一种多叉树森林K-匿名方法、系统、设备和可读存储介质,以识别率的计算为基础,解决了贪婪算法在局域泛化模式中每一步最优泛化数据选择的问题,建立多叉树森林实现了泛化数据的存储和局域泛化,以多线程的泛化数据选择和K-匿名的并行式计算判断提升了模型的效率。即在原始数据的基础上将部分数据泛化,使匿名后的数据集满足K-匿名模型。在保障数据安全性的条件下,不会影响数据本身的真实性。同时模型保留了数据本身的分布,提高数据匿名化后数据的可用性,适用于小型数据集和大型数据集的匿名化处理。