-
公开(公告)号:CN111860642A
公开(公告)日:2020-10-30
申请号:CN202010698044.1
申请日:2020-07-20
申请人: 深圳市检验检疫科学研究院 , 深圳海关信息中心 , 深圳海关动植物检验检疫技术中心 , 全国海关信息中心(全国海关电子通关中心)
IPC分类号: G06K9/62
摘要: 本发明实施例提供了一种不均衡样本分类方法及装置,其中一种不均衡样本分类方法包括:获取不均衡样本数据,所述不均衡样本数据包括样本数据和特征数据;利用所述样本数据和所述特征数据计算出样本贡献率;根据所述样本贡献率筛选出预设样本贡献阈值内的样本数据,确定为目标样本数据;将所述目标样本数据输入至样本分类模型中利用优化分类算法计算得到样本分类结果。通过利用特征取值贡献率和特征贡献程度两个变量,来剔除分类贡献度低的特征和样本,有效降低不均衡样本数据的处理,在此基础上利用机器学习算法,采用有效的特征或样本来实现高效的分类,在保证分类质量的前提下,同时提高了分类的效率。