-
公开(公告)号:CN117290364A
公开(公告)日:2023-12-26
申请号:CN202311575179.9
申请日:2023-11-24
申请人: 深圳市成为高科技有限公司
IPC分类号: G06F16/22 , G06Q30/0201 , G06F16/215 , G06F16/2457 , G06F16/28 , G06F18/23
摘要: 本发明涉及数据处理技术领域,具体涉及一种市场调查数据智能存储方法,包括:采集市场调查数据集,进行数据填补,得到更新数据集,将更新数据集依次划分为若干个小数据集,获取每个小数据集的填补数据频率统计必要性,从而得到更新数据集中每种填补数据类别的修正数据数量,将更新数据集划分为若干个聚类簇,获取每个聚类簇中每种数据类别的更新出现频率,由此进行压缩编码,得到更新数据集的压缩数据集,将压缩数据集存储至数据库中。本发明通过数据集分类、调整因填补数据带来的数据出现频率的误差,提高数据出现频率计算的准确性,从而提高数据压缩效率,降低市场调查数据所需的存储空间,由此提高存储效率。
-
公开(公告)号:CN117155406B
公开(公告)日:2024-02-02
申请号:CN202311413375.6
申请日:2023-10-30
申请人: 深圳市成为高科技有限公司
IPC分类号: H03M7/40
摘要: 本发明涉及数据压缩管理技术领域,具体涉及一种社会调查数据智能管理系统。该系统通过数据获取模块获取人口普查数据;通过数据处理模块分析人口普查数据中各类字符的频率,采用费诺编码,根据每次分组过程下的待确认二类分组中各类字符的频率与待确认一类分组中所有字符的频率获得各类字符的加权优选程度,进而获取每次分组过程下的最优字符类别分组;构建人口普查数据的编码树;通过数据压缩模块,获得人口普查压缩数据;通过数据存储模块对人口普查压缩数据进行存储。本发明通过考虑每次分组过程中分组之间的频率差异,自适应调整分组情况,减小分组之间字符频率的差异,提升数据压缩效果,优化了数据的智能管理系统。
-
公开(公告)号:CN117290364B
公开(公告)日:2024-01-30
申请号:CN202311575179.9
申请日:2023-11-24
申请人: 深圳市成为高科技有限公司
IPC分类号: G06F16/22 , G06Q30/0201 , G06F16/215 , G06F16/2457 , G06F16/28 , G06F18/23
摘要: 本发明涉及数据处理技术领域,具体涉及一种市场调查数据智能存储方法,包括:采集市场调查数据集,进行数据填补,得到更新数据集,将更新数据集依次划分为若干个小数据集,获取每个小数据集的填补数据频率统计必要性,从而得到更新数据集中每种填补数据类别的修正数据数量,将更新数据集划分为若干个聚类簇,获取每个聚类簇中每种数据类别的更新出现频率,由此进行压缩编码,得到更新数据集的压缩数据集,将压缩数据集存储至数据库中。本发明通过数据集分类、调整因填补数据带来的数据出现频率的误差,提高数据出现频率计算的准确性,从而提高数据压缩效率,降低市场调查数据所需的存储空间,由此提高存储效率。
-
公开(公告)号:CN117155406A
公开(公告)日:2023-12-01
申请号:CN202311413375.6
申请日:2023-10-30
申请人: 深圳市成为高科技有限公司
IPC分类号: H03M7/40
摘要: 本发明涉及数据压缩管理技术领域,具体涉及一种社会调查数据智能管理系统。该系统通过数据获取模块获取人口普查数据;通过数据处理模块分析人口普查数据中各类字符的频率,采用费诺编码,根据每次分组过程下的待确认二类分组中各类字符的频率与待确认一类分组中所有字符的频率获得各类字符的加权优选程度,进而获取每次分组过程下的最优字符类别分组;构建人口普查数据的编码树;通过数据压缩模块,获得人口普查压缩数据;通过数据存储模块对人口普查压缩数据进行存储。本发明通过考虑每次分组过程中分组之间的频率差异,自适应调整分组情况,减小分组之间字符频率的差异,提升数据压缩效果,优化了数据的智能管理系统。
-
-
-