一种基于聚类融合的半监督学习伪标签赋值方法

    公开(公告)号:CN112418331A

    公开(公告)日:2021-02-26

    申请号:CN202011348264.8

    申请日:2020-11-26

    IPC分类号: G06K9/62 G06N3/04 G06N3/08

    摘要: 本发明公开了一种基于聚类融合的半监督学习伪标签赋值方法,包括针对存在无标签数据集的卷积神经网络半监督学习,利用有标签数据和无标签数据进行所述神经网络预训练,并利用训练好的网络提取数据特征;利用最近邻法为距离有标签数据最近的N个无标签数据赋予伪标签;对全体数据信息使用k‑means聚类进行分析,为未赋标签的数据赋予聚类的伪标签;利用所述得到的标签数据和伪标签数据对所述卷积神经网络进行不断训练,得到最优网络进行标签赋值。可以适用于各个领域深度学习下的半监督学习;能充分挖掘无标签数据的信息,为网络提供内容更丰富的训练数据;原理清晰,容易理解,代码易实现。