-
公开(公告)号:CN111767326B
公开(公告)日:2020-11-27
申请号:CN202010914927.1
申请日:2020-09-03
Applicant: 国网浙江省电力有限公司营销服务中心 , 清华大学 , 国网浙江省电力有限公司
IPC: G06F16/2458 , G06F16/28 , G06F16/22 , G06K9/62
Abstract: 本申请属于数据生成技术领域,具体涉及一种基于生成式对抗网络的关系型表格数据的生成方法及装置。其中的方法包括:获取包括可分类数据、数字型数据、顺序型数据的原始的关系型表格数据;选择能唯一确定实体的可分类数据以确定相应的实体,将唯一确定实体的可分类数据作为实体标识属性;将包含实体标识属性的可分类属性元组作为条件信息,将随机噪声向量作为输入,通过预先训练的数据生成模型得到生成的关系型表格数据。本申请中的方法能同时学习离散分布与连续分布,抓取记录之间的关联;同时抓取实体层面多条记录的潜在趋势,准确生成与原数据分布近似的假数据,且数据的分布在表格层面拟合真实数据集。
-
公开(公告)号:CN111767326A
公开(公告)日:2020-10-13
申请号:CN202010914927.1
申请日:2020-09-03
Applicant: 国网浙江省电力有限公司营销服务中心 , 清华大学 , 国网浙江省电力有限公司
IPC: G06F16/2458 , G06F16/28 , G06F16/22 , G06K9/62
Abstract: 本申请属于数据生成技术领域,具体涉及一种基于生成式对抗网络的关系型表格数据的生成方法及装置。其中的方法包括:获取包括可分类数据、数字型数据、顺序型数据的原始的关系型表格数据;选择能唯一确定实体的可分类数据以确定相应的实体,将唯一确定实体的可分类数据作为实体标识属性;将包含实体标识属性的可分类属性元组作为条件信息,将随机噪声向量作为输入,通过预先训练的数据生成模型得到生成的关系型表格数据。本申请中的方法能同时学习离散分布与连续分布,抓取记录之间的关联;同时抓取实体层面多条记录的潜在趋势,准确生成与原数据分布近似的假数据,且数据的分布在表格层面拟合真实数据集。
-