文档检索模型训练方法、检索方法及存储介质
摘要:
本发明涉及自然语言处理技术领域,特别涉及一种文档检索模型训练方法、检索方法及存储介质,训练方法包括以下步骤:获取数据库和当前批次中的查询,在数据库中对应各查询分别检索获得样本,样本包括与各查询对应的正样本以及难负样本;对于其中一查询,以该批次中的除该查询对应的正样本之外的其余正样本以及难负样本作为批次内负样本;添加负样本缓存队列用于储存样本,对批次内负样本以及储存在负样本缓存队列中的样本进行过滤得到负样本;基于查询以及其对应的负样本以及正样本对文档检索模型进行训练;训练完成后,该批次训练用的负样本以及正样本储存于负样本缓存队列中。通过添加负样本缓存队列存储负样本以增加训练时的负样本数量。
公开/授权文献
0/0