数据集合的确定方法和装置
摘要:
本发明公开了一种数据集合的确定方法和装置。其中,该方法包括:接收到用于指示从多个第一数据集合中获取目标数据集合的指令,目标数据集合的数据用于进行数据分析;根据第一属性集合确定每个第一数据集合中每个实例数据的目标概率,目标概率为实例数据属于目标类型的概率,第一属性集合中包括用于指示为目标类型的数据的属性;基于每个第一数据集合中所有实例数据的目标概率确定每个第一数据集合的采集质量信息,采集质量信息用于指示按照目标类型采集到的第一数据集合的质量;确定多个第一数据集合中采集质量信息满足预设质量要求的为用于进行数据分析的目标数据集合。本发明解决了相关技术中无法获取到质量较高的数据集合的技术问题。
公开/授权文献
0/0