-
公开(公告)号:CN103902592B
公开(公告)日:2018-02-27
申请号:CN201210580817.1
申请日:2012-12-27
申请人: 深圳市腾讯计算机系统有限公司
IPC分类号: G06F17/30
CPC分类号: G06F17/30592 , G06F7/24 , G06F17/30224 , G06F17/30292 , G06F17/30318 , G06F17/30339 , G06F17/30412 , G06F17/30424 , G06F17/30575 , G06F17/30587
摘要: 本发明公开了一种基于MapReduce实现分析函数的方法及系统,涉及数据库领域,用于解决现有技术中基于MapReduce框架的分布式数据仓库无法使用分析函数进行数据进行分析处理的问题。本发明提供的处理数据的方法包括:表扫描算子从文件块获取数据行,将所述数据行发送至映射算子;所述映射算子接收所述数据行,确定分析函数的归约键、分割键和排序键,通过MapReduce框架将所述数据行发送至分析算子;所述分析算子接收所述数据行,对所述数据行进行分析得到分析结果,并将所述数据行和分析结果转发至后继算子。本发明适用于基于MapReduce框架的数据仓库领域,用于实现分析函数。
-
公开(公告)号:CN106156127B
公开(公告)日:2020-06-16
申请号:CN201510164053.1
申请日:2015-04-08
申请人: 深圳市腾讯计算机系统有限公司
IPC分类号: G06F16/9535
摘要: 本发明实施例公开了一种选择数据内容向终端推送的方法,其特征在于,包括:获取用户标识,获取所述用户标识对应的在预设的用户属性类型下的特征值;获取数据内容,查找与所述数据内容对应的决策树对象;根据与所述用户标识对应的在预设的用户属性类型下的特征值在所述决策树对象中定位与所述用户标识对应的叶结点;获取定位到的叶结点中存储的点击数和推送数,根据所述点击数和推送数生成选择参考值,根据所述选择参考值选择数据内容推送到与所述用户标识对应的终端。本发明还公开了一种选择数据内容向终端推送的装置。本发明中的决策树对象可在运行过程中实时得到更新,从而使得选择数据内容可参考较新的统计数据,从而提高了推送的准确度。
-
公开(公告)号:CN104574124B
公开(公告)日:2018-07-17
申请号:CN201310469930.7
申请日:2013-10-10
申请人: 深圳市腾讯计算机系统有限公司
IPC分类号: G06Q30/02
摘要: 本发明公开了一种确定广告数据的展示效果的方法及装置,属于广告技术领域。方法包括:获取待展示广告数据及待展示广告数据的展示信息及定向信息;根据展示信息及定向信息选取至少两项与待展示广告数据相似的广告数据;获取相似的广告数据的点击率,并根据相似的广告数据的点击率计算待展示广告数据的预估点击率;根据预估点击率确定待展示广告数据的展示效果。本发明通过展示信息及定向信息选取相似的广告数据,并在获取及根据相似的广告数据的点击率计算预估点击率后,根据预估点击率确定待展示广告数据的展示效果,因而无需将待展示广告数据实际展示即可确定待展示广告数据的展示效果,降低了成本,提高了效率。
-
公开(公告)号:CN104424287A
公开(公告)日:2015-03-18
申请号:CN201310389717.5
申请日:2013-08-30
申请人: 深圳市腾讯计算机系统有限公司
CPC分类号: G06F16/242
摘要: 本发明公开了一种数据查询方法和装置。其中,该方法包括:获取用于在数据表中查询满足预设查询条件的目标数据记录的查询指令;根据预设查询条件在行存储文件和列存储文件中判断出查询成本较低的一个作为查询对象,其中,在行存储文件中数据表中的数据记录按行保存,在列存储文件中数据表中的数据记录按列或列组保存;在判断出的查询对象中查询目标数据记录,并将查询出的目标数据记录进行返回。本发明解决了现有的数据查询方法的查询效率较低的技术问题,达到了提高数据查询效率的技术效果。
-
公开(公告)号:CN104424287B
公开(公告)日:2019-06-07
申请号:CN201310389717.5
申请日:2013-08-30
申请人: 深圳市腾讯计算机系统有限公司
IPC分类号: G06F16/245 , G06F16/22
摘要: 本发明公开了一种数据查询方法和装置。其中,该方法包括:获取用于在数据表中查询满足预设查询条件的目标数据记录的查询指令;根据预设查询条件在行存储文件和列存储文件中判断出查询成本较低的一个作为查询对象,其中,在行存储文件中数据表中的数据记录按行保存,在列存储文件中数据表中的数据记录按列或列组保存;在判断出的查询对象中查询目标数据记录,并将查询出的目标数据记录进行返回。本发明解决了现有的数据查询方法的查询效率较低的技术问题,达到了提高数据查询效率的技术效果。
-
公开(公告)号:CN104091276B
公开(公告)日:2015-08-26
申请号:CN201310672117.X
申请日:2013-12-10
申请人: 深圳市腾讯计算机系统有限公司
摘要: 本发明实施例公开了在线分析点击流数据的方法和相关装置及系统。其中一种在线分析点击流数据的方法,可包括:从广告业务服务器获取点击流数据;提取点击流数据中包含的关键信息;确定所述关键信息所对应的点击流类型;确定第一时间窗口;根据所述关键信息对应的点击流类型,以及所述关键信息对应的日志时间与第一时间窗口的对应关系,确定所述关键信息是否需要被过滤;若确定所述关键信息无需被过滤,则利用关键信息生成广告投放预测模型的训练数据。本发明实施例提供的技术方案有利于降低处理资源对得到训练数据的限制、提高广告投放预测模型的实时性、提高广告投放预测模型与线上实时数据的吻合度。
-
公开(公告)号:CN104574124A
公开(公告)日:2015-04-29
申请号:CN201310469930.7
申请日:2013-10-10
申请人: 深圳市腾讯计算机系统有限公司
IPC分类号: G06Q30/02
摘要: 本发明公开了一种确定广告数据的展示效果的方法及装置,属于广告技术领域。方法包括:获取待展示广告数据及待展示广告数据的展示信息及定向信息;根据展示信息及定向信息选取至少两项与待展示广告数据相似的广告数据;获取相似的广告数据的点击率,并根据相似的广告数据的点击率计算待展示广告数据的预估点击率;根据预估点击率确定待展示广告数据的展示效果。本发明通过展示信息及定向信息选取相似的广告数据,并在获取及根据相似的广告数据的点击率计算预估点击率后,根据预估点击率确定待展示广告数据的展示效果,因而无需将待展示广告数据实际展示即可确定待展示广告数据的展示效果,降低了成本,提高了效率。
-
公开(公告)号:CN106156127A
公开(公告)日:2016-11-23
申请号:CN201510164053.1
申请日:2015-04-08
申请人: 深圳市腾讯计算机系统有限公司
IPC分类号: G06F17/30
摘要: 本发明实施例公开了一种选择数据内容向终端推送的方法,其特征在于,包括:获取用户标识,获取所述用户标识对应的在预设的用户属性类型下的特征值;获取数据内容,查找与所述数据内容对应的决策树对象;根据与所述用户标识对应的在预设的用户属性类型下的特征值在所述决策树对象中定位与所述用户标识对应的叶结点;获取定位到的叶结点中存储的点击数和推送数,根据所述点击数和推送数生成选择参考值,根据所述选择参考值选择数据内容推送到与所述用户标识对应的终端。本发明还公开了一种选择数据内容向终端推送的装置。本发明中的决策树对象可在运行过程中实时得到更新,从而使得选择数据内容可参考较新的统计数据,从而提高了推送的准确度。
-
公开(公告)号:CN103902592A
公开(公告)日:2014-07-02
申请号:CN201210580817.1
申请日:2012-12-27
申请人: 深圳市腾讯计算机系统有限公司
IPC分类号: G06F17/30
CPC分类号: G06F17/30592 , G06F7/24 , G06F17/30224 , G06F17/30292 , G06F17/30318 , G06F17/30339 , G06F17/30412 , G06F17/30424 , G06F17/30575 , G06F17/30587
摘要: 本发明公开了一种基于MapReduce实现分析函数的方法及系统,涉及数据库领域,用于解决现有技术中基于MapReduce框架的分布式数据仓库无法使用分析函数进行数据进行分析处理的问题。本发明提供的处理数据的方法包括:表扫描算子从文件块获取数据行,将所述数据行发送至映射算子;所述映射算子接收所述数据行,确定分析函数的归约键、分割键和排序键,通过MapReduce框架将所述数据行发送至分析算子;所述分析算子接收所述数据行,对所述数据行进行分析得到分析结果,并将所述数据行和分析结果转发至后继算子。本发明适用于基于MapReduce框架的数据仓库领域,用于实现分析函数。
-
公开(公告)号:CN104091276A
公开(公告)日:2014-10-08
申请号:CN201310672117.X
申请日:2013-12-10
申请人: 深圳市腾讯计算机系统有限公司
摘要: 本发明实施例公开了在线分析点击流数据的方法和相关装置及系统。其中一种在线分析点击流数据的方法,可包括:从广告业务服务器获取点击流数据;提取点击流数据中包含的关键信息;确定所述关键信息所对应的点击流类型;确定第一时间窗口;根据所述关键信息对应的点击流类型,以及所述关键信息对应的日志时间与第一时间窗口的对应关系,确定所述关键信息是否需要被过滤;若确定所述关键信息无需被过滤,则利用关键信息生成广告投放预测模型的训练数据。本发明实施例提供的技术方案有利于降低处理资源对得到训练数据的限制、提高广告投放预测模型的实时性、提高广告投放预测模型与线上实时数据的吻合度。
-
-
-
-
-
-
-
-
-