Invention Grant
- Patent Title: 一种基于深度强化学习模型的数据清洗方法及装置
-
Application No.: CN202010128327.2Application Date: 2020-02-28
-
Publication No.: CN113326689BPublication Date: 2023-08-18
- Inventor: 张学君 , 林格平 , 万辛 , 沈亮 , 宁珊 , 颜永红
- Applicant: 中国科学院声学研究所 , 国家计算机网络与信息安全管理中心
- Applicant Address: 北京市海淀区北四环西路21号;
- Assignee: 中国科学院声学研究所,国家计算机网络与信息安全管理中心
- Current Assignee: 中国科学院声学研究所,国家计算机网络与信息安全管理中心
- Current Assignee Address: 北京市海淀区北四环西路21号;
- Agency: 北京方安思达知识产权代理有限公司
- Agent 陈琳琳; 杨青
- Main IPC: G06F40/205
- IPC: G06F40/205 ; G06F40/211 ; G06F18/214 ; G06F18/2415 ; G06N3/045 ; G06N3/092

Abstract:
本发明属于数据通信和数据处理技术领域,具体涉及一种基于深度强化学习模型的数据清洗方法,该方法包括:获取待清洗的带标签的数据集;采用预筛选算法,删除待清洗的带标签的数据集中的无内容数据、不在标签集内的标签数据和标签矛盾的数据,获得待分类的数据集;将待分类的数据集输入至预先训练的深度强化学习模型中,获得不同类别的延迟奖励;再根据获得的不同类别的延迟奖励,依据预先训练的深度强化学习模型中的动作集合,丢弃掉有偏数据,保留有效数据,并更新状态列表S,最大化每一类别的延迟奖励值,将每一类别的最大延迟奖励值对应的带标签的训练数据集作为清洗干净的带标签的训练数据集,从而完成数据清洗。
Public/Granted literature
- CN113326689A 一种基于深度强化学习模型的数据清洗方法及装置 Public/Granted day:2021-08-31
Information query