发明公开
- 专利标题: 一种适用于无标签不平衡数据流的在线主动学习方法
- 专利标题(英): online active learning method suitable for a label-free unbalanced data stream
-
申请号: CN201910001840.2申请日: 2019-01-02
-
公开(公告)号: CN109800799A公开(公告)日: 2019-05-24
- 发明人: 吴庆耀 , 张一帆 , 谭明奎
- 申请人: 华南理工大学
- 申请人地址: 广东省广州市天河区五山路381号
- 专利权人: 华南理工大学
- 当前专利权人: 华南理工大学
- 当前专利权人地址: 广东省广州市天河区五山路381号
- 代理机构: 广州粤高专利商标代理有限公司
- 代理商 何淑珍; 江裕强
- 优先权: 201811652531.3 2018.12.31 CN
- 主分类号: G06K9/62
- IPC分类号: G06K9/62
摘要:
本发明提供了一种适用于无标签不平衡数据流的在线主动学习方法,包括:无标签数据流时序的输入线性分类器中进行预测,其中数据流的类别具有高度不平衡问题,即正类样本数量稀少;根据提出的非对称访问策略,线性分类器针对不平衡数据,动态地决定需要被标注标签的样本;根据提出的非对称更新策略,线性分类器利用错误预测的标注数据更新线性分类器,并利用样本的二阶信息提高学习效率;本发明的一种适用于无标签不平衡数据流的在线主动学习方法利用样本的二阶信息,提出了新的非对称策略;该非对称策略同时考虑样本的标注和模型的更新,能够更好地解决样本的类别不平衡问题,并提升基于流数据的主动学习模型的分类性能。