一种基于霍夫丁树的多标签流数据分类方法

    公开(公告)号:CN114116669B

    公开(公告)日:2024-07-12

    申请号:CN202111412707.X

    申请日:2021-11-25

    Applicant: 燕山大学

    Inventor: 梁顺攀 潘维维

    Abstract: 本发明公开了一种基于霍夫丁树的多标签流数据分类方法,属于模式识别与数据挖掘技术领域。训练阶段步骤:新实例逐条流入模型;根据实例特征数量构建基分类器并分别分配若干特征,进行增量式学习;将上述结构作为基本单元做分层级联,每一层有若干个互不相同的基本单元;每一层训练时进行三折交叉验证得到各单元的权值,并验证当前层的分类性能;预测阶段步骤:新实例逐条流入训练好的模型,获取当前实例的特征向量;特征划分;将每个基本单元针对当前实例的预测值施加训练时确定的权值,与原始特征拼接后作为下一层的输入特征;统计每一层对当前测试实例的预测精度,若没有明显增长则停止模型增长,并取最后一层的预测值为最终预测结果。

    一种基于霍夫丁树的多标签流数据分类方法

    公开(公告)号:CN114116669A

    公开(公告)日:2022-03-01

    申请号:CN202111412707.X

    申请日:2021-11-25

    Applicant: 燕山大学

    Inventor: 梁顺攀 潘维维

    Abstract: 本发明公开了一种基于霍夫丁树的多标签流数据分类方法,属于模式识别与数据挖掘技术领域。训练阶段步骤:新实例逐条流入模型;根据实例特征数量构建基分类器并分别分配若干特征,进行增量式学习;将上述结构作为基本单元做分层级联,每一层有若干个互不相同的基本单元;每一层训练时进行三折交叉验证得到各单元的权值,并验证当前层的分类性能;预测阶段步骤:新实例逐条流入训练好的模型,获取当前实例的特征向量;特征划分;将每个基本单元针对当前实例的预测值施加训练时确定的权值,与原始特征拼接后作为下一层的输入特征;统计每一层对当前测试实例的预测精度,若没有明显增长则停止模型增长,并取最后一层的预测值为最终预测结果。

Patent Agency Ranking