-
公开(公告)号:CN116796856A
公开(公告)日:2023-09-22
申请号:CN202310789592.9
申请日:2023-06-30
申请人: 北京航空航天大学
IPC分类号: G06N20/00 , G06F18/24 , G06F18/214
摘要: 本发明通过软件工程和人工智能领域的方法,实现了一种面向分类任务的机器学习模型选择方法,总体上包括样本标注优先级排序算法、样本筛选与标注、模型测试与排序三个部分;输入是一组候选模型和一个未标注的目标任务数据集,输出是这组模型中在这个数据集上表现最好的一个模型,通过五个步骤实现模型的对比测试与选择;本发明采用样本标注优先级评估算法,主要从样本分类置信度、样本标签误判程度两个方面评估样本标注优先级,以此筛选出小部分样本进行标注,降低了对比测试的标注成本;同时使用样本优先级评估算法针对现有数据集挑选少量样本对模型进行微调,有效地提高了模型的准确度。