发明授权
- 专利标题: 用于语料处理的质量控制方法及装置
-
申请号: CN201811191981.7申请日: 2018-10-12
-
公开(公告)号: CN109543006B公开(公告)日: 2021-07-23
- 发明人: 周义廷 , 汪冠春 , 胡一川 , 张海雷
- 申请人: 北京来也网络科技有限公司
- 申请人地址: 北京市海淀区科学院南路2号融科资讯中心A座701
- 专利权人: 北京来也网络科技有限公司
- 当前专利权人: 北京来也网络科技有限公司
- 当前专利权人地址: 北京市海淀区科学院南路2号融科资讯中心A座701
- 代理机构: 北京知果之信知识产权代理有限公司
- 代理商 唐海力; 李志刚
- 主分类号: G06F16/332
- IPC分类号: G06F16/332 ; G06F16/36
摘要:
本申请公开了一种用于语料处理的质量控制方法及装置。该方法包括接收通过众包任务获得的改述语料;判断所述改述语料是否满足第一质量控制条件;如果判断所述改述语料满足第一质量控制条件,则将所述改述语料入库;如果判断所述改述语料不满足第一质量控制条件,则触发校验众包任务发布;判断所述校验众包任务是否满足第二质量控制条件;以及如果判断所述校验众包任务满足第二质量控制条件,则将所述改述语料入库。本申请解决了当获得用于自然语言生成的相关语料后无法确保语料的质量的问题技术问题。通过本申请可综合众包质量控制方法,并利用NLP自然语言处理技术、各类指标,可以监控发布的众包任务结果的正确性、多样性和自然性。
公开/授权文献
- CN109543006A 用于语料处理的质量控制方法及装置 公开/授权日:2019-03-29