一种基于众包模式的样本标注方法
摘要:
本发明公开了一种基于众包模式的样本标注方法,包括以下步骤:1)获取未标注的多元时间序列数据集,抽取选择数据集中需要标注的样本;2)对所有标注者,基于每个标注者的标注准确度和标注成本,选择达到置信度阈值且成本最低的标注者集,作为成本效益众包标注模型;3)对抽取的需要标注的样本,基于成本效益众包标注模型得到标注结果,将标注后的样本加入标注数据集,并将其逆最近邻样本与该未标注样本分为同一类,加入标记数据集,得到更新后的标记数据集;4)计算停止标准,达到停止条件后,得到多元时间序列数据集对应的最终的标记数据集结果。本发明方法用于实现对未标注样本可靠且低成本的标注。
0/0