发明公开
- 专利标题: 数据集合的确定方法和装置
- 专利标题(英): Data set determination method and device
-
申请号: CN201710069739.1申请日: 2017-02-08
-
公开(公告)号: CN106844718A公开(公告)日: 2017-06-13
- 发明人: 何彬彬
- 申请人: 腾讯科技(深圳)有限公司
- 申请人地址: 广东省深圳市南山区高新区科技中一路腾讯大厦35层
- 专利权人: 腾讯科技(深圳)有限公司
- 当前专利权人: 腾讯科技(深圳)有限公司
- 当前专利权人地址: 广东省深圳市南山区高新区科技中一路腾讯大厦35层
- 代理机构: 北京康信知识产权代理有限责任公司
- 代理商 董文倩; 褚敏
- 主分类号: G06F17/30
- IPC分类号: G06F17/30
摘要:
本发明公开了一种数据集合的确定方法和装置。其中,该方法包括:接收到用于指示从多个第一数据集合中获取目标数据集合的指令,目标数据集合的数据用于进行数据分析;根据第一属性集合确定每个第一数据集合中每个实例数据的目标概率,目标概率为实例数据属于目标类型的概率,第一属性集合中包括用于指示为目标类型的数据的属性;基于每个第一数据集合中所有实例数据的目标概率确定每个第一数据集合的采集质量信息,采集质量信息用于指示按照目标类型采集到的第一数据集合的质量;确定多个第一数据集合中采集质量信息满足预设质量要求的为用于进行数据分析的目标数据集合。本发明解决了相关技术中无法获取到质量较高的数据集合的技术问题。
公开/授权文献
- CN106844718B 数据集合的确定方法和装置 公开/授权日:2022-04-26