- 专利标题: 负样本挖掘方法、装置、电子设备及存储介质
-
申请号: CN202011445714.5申请日: 2020-12-08
-
公开(公告)号: CN112560928A公开(公告)日: 2021-03-26
- 发明人: 陈徐屹 , 卢宇翔 , 冯仕堃
- 申请人: 北京百度网讯科技有限公司
- 申请人地址: 北京市海淀区上地十街10号百度大厦2层
- 专利权人: 北京百度网讯科技有限公司
- 当前专利权人: 北京百度网讯科技有限公司
- 当前专利权人地址: 北京市海淀区上地十街10号百度大厦2层
- 代理机构: 北京鸿德海业知识产权代理有限公司
- 代理商 谷春静
- 主分类号: G06K9/62
- IPC分类号: G06K9/62 ; G06N20/00
摘要:
本申请公开了负样本挖掘方法、装置、电子设备及存储介质,涉及深度学习及自然语言处理等人工智能领域,其中的方法可包括:在利用至少两个图形处理器进行多机模型训练时,任一图形处理器分别进行以下处理:在任一训练批次内,分别将训练批次内的各查询作为待处理查询;针对各待处理查询,分别将训练批次内除待处理查询外的其它各查询以及除自身外的其它各图形处理器对应的训练批次内的各查询作为关联查询,将各关联查询对应的样本作为待处理查询对应的弱负样本,对应的样本包括正样本和/或强负样本。应用本申请所述方案,可提升模型训练效果及数据利用率等。
公开/授权文献
- CN112560928B 负样本挖掘方法、装置、电子设备及存储介质 公开/授权日:2021-10-26