一种基于间隔优化的集成学习方法及装置

    公开(公告)号:CN108090510A

    公开(公告)日:2018-05-29

    申请号:CN201711345271.0

    申请日:2017-12-15

    IPC分类号: G06K9/62

    CPC分类号: G06K9/6227 G06K9/6256

    摘要: 本发明公开了一种基于间隔优化的集成学习方法及装置。其中,所述方法包括:1)得到一组训练好的基分类器;2)获取基分类器对所有训练样本的预测值;3)通过最优化集成模型间隔的分布来优化每个基分类器的权重;4)使用优化后的权重对样本的预测值进行加权平均,从而得到最终的预测值和标记。本发明还公开了一种基于间隔优化的集成学习装置。本发明中基于间隔优化的集成学习方法及装置不依赖于具体的基分类算法,可以针对分类误差或AUC进行优化,且整个模型易于求解,具有十分广泛的适用性。在优化权重时通过引入了间隔来平衡准确性和多样性,可以有效的避免过拟合问题,并提高最终集成模型的预测效果。

    基于异构信息网络和贝叶斯个性化排序的推荐方法及装置

    公开(公告)号:CN106934071A

    公开(公告)日:2017-07-07

    申请号:CN201710286010.X

    申请日:2017-04-27

    IPC分类号: G06F17/30 G06K9/62 G06N7/00

    摘要: 本发明公开了一种基于异构信息网络和贝叶斯个性化排序的推荐方法及装置。所述方法使用异构信息网络来描述用户、物品及有关的信息,并使用基于带重启的随机游走的迭代方法来计算用户对每个物品的评分。对于异构信息网络中的各边的权重,本方法使用基于贝叶斯个性化排序的机器学习方法自动学习。在学习的过程中,本方法通过多次迭代求解,并从多轮迭代得到的多个候选解中选择最优的解。本发明还公开了一种基于异构信息网络和贝叶斯个性化排序的推荐装置。本发明中的推荐方法及装置,不仅可以自动的从数据中学习各异构信息网络中边的权重,从而大大提高对不同数据的适应能力,还可以更好的对用户偏好进行刻画,从而得到更好的个性化推荐结果。

    一种基于主动学习和模型剪枝的集成学习方法及装置

    公开(公告)号:CN106779086A

    公开(公告)日:2017-05-31

    申请号:CN201611060500.X

    申请日:2016-11-28

    IPC分类号: G06N99/00

    CPC分类号: G06N20/00

    摘要: 本发明公开了一种综合了主动学习技术和模型剪枝技术的集成学习方法及装置。所述集成学习方法包括:通过度量未标注样本对集成模型的适用程度,自动的从未标记样本集合中选择关键样本,交给人工标注,并用以重新训练集成模型,从而提高集成模型的准确度;通过度量某个模型集合对一组已标注数据的适用程度,对已有的模型集合做筛选,得到一个更优的子集;将最终保留的模型集合集成起来,形成最终的集成模型。本发明还公开了一种综合了主动学习技术和模型剪枝技术的集成学习装置。本发明不仅可以利用未标注数据,还降低了人工标注成本,同时降低了集成模型的复杂度,提高了集成模型的性能。