-
公开(公告)号:CN113792202A
公开(公告)日:2021-12-14
申请号:CN202111015189.8
申请日:2021-08-31
申请人: 中国电子科技集团公司第三十研究所 , 深圳市网联安瑞网络科技有限公司
IPC分类号: G06F16/906 , G06F16/26
摘要: 本发明提供一种用户分类的筛选方法,包括用户历史数据的处理步骤和用户新增数据的处理步骤;用户历史数据的处理步骤包括:获取用户历史数据;根据预设的分类规则引擎对用户历史数据组成的样本集群按照关键进行分类得到多个样本类群;用户新增数据的处理步骤包括:对每个样本类群的用户历史数据进行量化,得到每一个样本类群的类群特征信息,将每个样本类群的关键词和类群特征信息作为结构化数据;获取用户新增数据并提取用户新增数据的结构化数据,通过将用户新增数据的结构化数据与分类规则引擎中每一个样本类群的结构化数据进行匹配进行分类。本发明通过设置分类规则引擎有效合理地将全量用户进行分类,用户信息管理更加清晰高效,且使用方便。
-
公开(公告)号:CN112800044B
公开(公告)日:2024-01-19
申请号:CN202110171425.9
申请日:2021-02-04
申请人: 深圳市网联安瑞网络科技有限公司
IPC分类号: G06F16/215 , G06F16/23 , G06F16/2458 , G06F16/25
摘要: 本发明公开一种数据质量判定及监测方法、管理系统、存储介质、终端,涉及数据处理技术领域。对不同来源的数据,根据每个字段配置的质量判定规则,进行数据质量判定,并对每一项质量要求进行逐一核查,所有检测项均判定合格后入库;对于数据质量判定过程中发现的不合格数据,根据所述不合格数据异常类型配置对应的处理程序,保留有价值的数据,去除无用的数据;对数据持续进行质量监测,进行重复率、缺失率、错误率相关指标统计分析,最终输出数据质量报告。本发明在质量判定的过程中,持续监测各个数据源的质量,形成数据质量报告,反馈到数据源处进行整改,有效提高数据质量管理的效率。
-
公开(公告)号:CN113792202B
公开(公告)日:2023-05-05
申请号:CN202111015189.8
申请日:2021-08-31
申请人: 中国电子科技集团公司第三十研究所 , 深圳市网联安瑞网络科技有限公司
IPC分类号: G06F16/906 , G06F16/26
摘要: 本发明提供一种用户分类的筛选方法,包括用户历史数据的处理步骤和用户新增数据的处理步骤;用户历史数据的处理步骤包括:获取用户历史数据;根据预设的分类规则引擎对用户历史数据组成的样本集群按照关键进行分类得到多个样本类群;用户新增数据的处理步骤包括:对每个样本类群的用户历史数据进行量化,得到每一个样本类群的类群特征信息,将每个样本类群的关键词和类群特征信息作为结构化数据;获取用户新增数据并提取用户新增数据的结构化数据,通过将用户新增数据的结构化数据与分类规则引擎中每一个样本类群的结构化数据进行匹配进行分类。本发明通过设置分类规则引擎有效合理地将全量用户进行分类,用户信息管理更加清晰高效,且使用方便。
-
公开(公告)号:CN112800044A
公开(公告)日:2021-05-14
申请号:CN202110171425.9
申请日:2021-02-04
申请人: 深圳市网联安瑞网络科技有限公司
IPC分类号: G06F16/215 , G06F16/23 , G06F16/2458 , G06F16/25
摘要: 本发明公开一种数据质量判定及监测方法、管理系统、存储介质、终端,涉及数据处理技术领域。对不同来源的数据,根据每个字段配置的质量判定规则,进行数据质量判定,并对每一项质量要求进行逐一核查,所有检测项均判定合格后入库;对于数据质量判定过程中发现的不合格数据,根据所述不合格数据异常类型配置对应的处理程序,保留有价值的数据,去除无用的数据;对数据持续进行质量监测,进行重复率、缺失率、错误率相关指标统计分析,最终输出数据质量报告。本发明在质量判定的过程中,持续监测各个数据源的质量,形成数据质量报告,反馈到数据源处进行整改,有效提高数据质量管理的效率。
-
-
-