-
公开(公告)号:CN102298569B
公开(公告)日:2016-03-16
申请号:CN201110184798.6
申请日:2011-06-23
Applicant: 微软技术许可有限责任公司
IPC: G06F15/18
CPC classification number: G06N99/005
Abstract: 本发明揭示了在线学习算法的并行化。提供了用于在线学习算法的并行化中使用的动态批策略的方法、系统,和媒介。该动态批策略提供了以原始模型状态和经更新的模型状态之间的阈值级别差异为基础的、而非根据恒定或预定批大小的合并功能。该合并过程包括读取一批传入流数据,从合作处理器检索任何缺少的模型信任,并且在该批传入流数据上进行训练。重复各读取、检索和训练步骤,直到所测得的状态差异超过设定的阈值级别。根据各属性,为多个处理器中的每一个合并所测得的超过阈值级别的差异。合并的超过阈值级别的差异与原始部分模型状态组合以获得经更新的全局模型状态。
-
公开(公告)号:CN102388382B
公开(公告)日:2015-11-25
申请号:CN201080016627.6
申请日:2010-04-01
Applicant: 微软技术许可有限责任公司
CPC classification number: G06N99/005 , G06K9/6226
Abstract: 描述了可缩放群集系统。在一个实施例中,群集系统可用于极大规模的应用,其中具有数千万的特征的数百万的项被群集。在一个实施例中,群集系统使用对数据集中的不确定性进行建模的概率群集模型,其中数据集可以是例如订阅关键词的广告、包含文本关键词的文本文档、具有相关联的特征的图像或其他项。在一个实施例中,群集系统被用于生成附加特征用于与给定项相关联。例如,建议广告者可能想订阅的附加关键词。在某些实施例中,所生成的附加特征具有可用于对那些特征进行排序的相关联的概率值。在某些示例中,用户对所生成的特征的返回被接收,并且用于修订特征生成过程。
-