一种二分类器的训练方法、装置、及计算机设备

    公开(公告)号:CN109086791A

    公开(公告)日:2018-12-25

    申请号:CN201810658424.5

    申请日:2018-06-25

    发明人: 宋博文

    IPC分类号: G06K9/62

    摘要: 公开了一种二分类器的训练方法、装置及计算机设备,该方法包括:利用以下步骤进行迭代处理,直至迭代次数达到预设的次数阈值:利用设定的学习算法与训练样本集进行训练,得到弱分类器,所述训练样本集中包括多个训练样本,所述多个训练样本中的任一训练样本具有权重;基于所述弱分类器的受试者工作特征ROC曲线确定所述弱分类器的分类阈值;得到所述弱分类器利用所述分类阈值对所述训练样本集的指定部分样本子集中任一训练样本的分类结果;基于所述分类结果对所述多个训练样本中的任一训练样本的权重进行调整;迭代结束后,对每一次迭代得到的弱分类器进行整合得到二分类器。

    一种基于随机森林的窃电行为的发现方法

    公开(公告)号:CN107862347A

    公开(公告)日:2018-03-30

    申请号:CN201711260280.X

    申请日:2017-12-04

    IPC分类号: G06K9/62

    摘要: 本发明公开了一种基于随机森林的窃电行为的发现方法,包括以下步骤:获取电力系统用户数据并从营销系统中抽取需要判定的用户数据并进行筛选,剔除不存在窃电可能的数据;对筛选后的原始数据进行预处理,特征进行提取包括提取方差特征和提取含零百分数特征;利用随机森林算法对预处理后的数据进行测试并计算得出最终的实验结果。本发明极大消除了现行人工防窃电方法存在的消耗大量人力物力的弊端,降低了防窃电工作的工作成本,提高了防窃电工作的工作效率。同时采用大数据工具协助处理防窃电工作,有助于提高防窃电工作的准确度,是电力行业大势所趋。

    用于基于视频模式检测运动的系统和方法

    公开(公告)号:CN107666561A

    公开(公告)日:2018-02-06

    申请号:CN201710616852.7

    申请日:2017-07-26

    IPC分类号: H04N5/14

    摘要: 本申请涉及用于基于视频模式检测运动的系统和方法。其中,用于基于视频模式检测运动的一些系统和方法可以包括从原始图像的序列创建运动图像,用与PIR传感器和相关联的Fresnel透镜相关联的透镜模式对运动图像进行掩膜,将透镜模式的多个块中的每个划分成第一和第二负区域,将正区域像素值识别为与多个块中的第一正区域对准的运动图像中的所有像素的总和,将负区域像素值识别为与多个块中的第二负区域对准的运动图像中的所有像素的总和,将运动图像响应值识别为正和负区域像素值之间的偏差,并且当运动图像响应值超过预定值时识别运动的存在。

    融合多视图和半监督学习的搜索引擎用户信息需求满意度评估方法

    公开(公告)号:CN105488522A

    公开(公告)日:2016-04-13

    申请号:CN201510824301.0

    申请日:2015-11-23

    IPC分类号: G06K9/62 G06F17/30

    CPC分类号: G06K9/6293 G06F17/30864

    摘要: 本发明涉及融合多视图和半监督学习的搜索引擎用户信息需求满意度评估方法,该方法分为数据预处理、训练子视图满意度模型、对未标注数据分配伪标签、训练基于多视图和半监督学习的用户满意度模型和评估六个阶段,本发明通过半监督学习的方法使用少量标注数据和大量未标注数据来提高评估模型的性能,并引入多视图学习的思想来克服传统的基于单视图的半监督学习方法容易陷入局部最优的问题。有益效果在于:(1)可以在少量的标注数据的情况下,有效地评估搜索引擎的用户信息需求满意度;(2)可以通过使用少量标注数据和大量未标注数据来提高用户满意度模型评估性能;(3)分别从行为和时间的角度来描述用户的搜索过程,通过相互学习来避免模型陷入局部最优。