发明公开
- 专利标题: 一种机器学习的均衡方法及相关装置
-
申请号: CN202111674899.1申请日: 2021-12-31
-
公开(公告)号: CN114462620A公开(公告)日: 2022-05-10
- 发明人: 杨海钦 , 赵嘉晨
- 申请人: 粤港澳大湾区数字经济研究院(福田)
- 申请人地址: 广东省深圳市福田区福保街道市花路长富金茂大厦1号楼39楼3901单元
- 专利权人: 粤港澳大湾区数字经济研究院(福田)
- 当前专利权人: 粤港澳大湾区数字经济研究院(福田)
- 当前专利权人地址: 广东省深圳市福田区福保街道市花路长富金茂大厦1号楼39楼3901单元
- 主分类号: G06N20/00
- IPC分类号: G06N20/00 ; G06K9/62
摘要:
本申请公开了一种机器学习的均衡方法及相关装置,所述方法包括从所属正确类别为主要类别的训练样本中,按照预设概率筛选部分训练样本作为目标训练样本;对原始类别序列中的类别标签进行错排以形成错排类别序列;基于目标训练样本和错排类别序列生成错排输入数据;以错排输入数据对机器学习模型进行训练。本申请通过错排方式将部分正确类别为主要类别的训练样本的原始类别序列修改为错排类别序列,这样即可以保留所有训练样本,使得机器学习可以学习到所有训练样本所携带的特征信息,同时又阻止机器学习模型对主要类别的过度学习,使得机器学习在主要类别上的权重更新变小且次要类别不受影响,使得机器学习的训练过程更加平衡,提高了模型性能。