-
公开(公告)号:CN117932335A
公开(公告)日:2024-04-26
申请号:CN202410021912.0
申请日:2024-01-05
Applicant: 之江实验室
IPC: G06F18/214 , G06F18/2415 , G06F18/21 , G06N3/092
Abstract: 在本说明书提供的一种训练样本筛选方法及装置中,获取待训练的分类模型,通过迭代筛选训练样本进行标注,更新已标注样本池,该已标注样本池用于训练该分类模型,直至分类模型达到收敛条件为止,其中,针对每一迭代过程,通过分类模型确定各训练样本的当前预测概率分布,获取各训练样本的历史预测概率分布,根据历史预测概率分布、当前预测概率分布以及确定的已标注样本池中各类别标注分别对应的训练样本的占比,确定总分值,按照总分值的排序,筛选训练样本进行标注。考虑了训练样本的历史信息以及训练样本为各类别标注的倾向,以及通过总分值进行训练样本的筛选,通用性更高,提高了训练效率。