-
公开(公告)号:CN117688999A
公开(公告)日:2024-03-12
申请号:CN202311841310.1
申请日:2023-12-28
申请人: 北京字跳网络技术有限公司
摘要: 本申请实施例提供一种排序模型的训练的方法、搜索方法、装置及其设备,训练设备通过获取多个用户的训练数据,训练数据包括用户授权的历史搜索行为序列、当前时间之前的第一时间内的用户授权的最新搜索会话数据和即时搜索行为序列,根据历史搜索行为序列确定用户的历史搜索特征,根据即时搜索行为序列确定用户的即时搜索特征,根据最新搜索会话数据确定用户的最新搜索特征,对用户的历史搜索特征和即时搜索特征进行特征组合,得到组合搜索特征,使用该组合搜索特征和最新搜索特征对排序模型进行训练。由于获取的即时搜索行为序列的时延很小,基于该即时搜索行为序列对排序模型进行训练和预测,能够提高排序模型的排序结果的准确性。
-
公开(公告)号:CN117744734A
公开(公告)日:2024-03-22
申请号:CN202311843751.5
申请日:2023-12-28
申请人: 北京字跳网络技术有限公司
摘要: 本申请提供了一种排序模型训练方法、搜索结果排序方法、装置和设备,其中模型训练方法包括:基于用户输入的搜索词,获取搜索词特征、与搜索词对应搜索内容的内容特征以及搜索内容的位置特征;将搜索词特征和搜索内容的内容特征输入排序模型得到交互值;将搜索内容的位置特征输入位置偏置模型得到位置偏置值;基于交互值和位置偏置值,对排序模型和位置偏置模型进行训练,得到目标排序模型。本申请通过基于搜索内容的展示位置来训练排序模型,使得训练得到的排序模型可以消除位置偏置,从而利用排序模型进行搜索内容排序时,可以提高搜索结果的排序准确性,满足用户的搜索需求,提升用户的搜索满意度。
-
公开(公告)号:CN117634576A
公开(公告)日:2024-03-01
申请号:CN202311841693.2
申请日:2023-12-28
申请人: 北京字跳网络技术有限公司
发明人: 冯太锐
摘要: 本申请实施例提供一种排序模型的训练的方法、搜索方法、装置及其设备,获取多个用户的搜索会话数据,根据搜索会话数据获取用户的搜索词特征、文档特征、第一特征和第二特征,对搜索词特征、文档特征和第一特征进行特征交叉得到用户的长期搜索特征,对搜索词特征、文档特征和第二特征进行特征交叉得到用户的短期搜索特征,其中,该第一特征和第二特征是对用户标识处理得到的,排序模型使用用户的长期搜索偏好和短期搜索偏好预测搜索文档的预测交互概率,在模型的参数更新时使用两个不同的优化器分别对用户长期搜索相关参数和用户短期搜索相关参数进行优化,从而使得排序模型的排序结果能够满足用户需求,提高了用户对搜索结果的满意度。
-
公开(公告)号:CN117709431A
公开(公告)日:2024-03-15
申请号:CN202311844870.2
申请日:2023-12-28
申请人: 北京字跳网络技术有限公司
发明人: 冯太锐
摘要: 本申请实施例提供一种消除偏差的模型训练方法、搜索方法、装置及其设备,通过获取每个搜索文档的文档体裁,根据每个搜索文档的文档体裁以及该搜索文档之前的搜索文档的文档体裁获取每个搜索文档的满意度特征,将每个搜索文档的满意度特征输入偏差模型,得到每个搜索文档的满意度偏差预测值,通过偏差模型消除文档体裁对搜索文档的排序影响,使得排序模型可以学习到每个搜索文档的文档体裁对搜索文档的排序影响,提高了搜索结果的排序准确性,提升用户对搜索结果的满意度。
-
公开(公告)号:CN117708386A
公开(公告)日:2024-03-15
申请号:CN202410051701.1
申请日:2024-01-12
申请人: 北京字跳网络技术有限公司
发明人: 冯太锐
IPC分类号: G06F16/903 , G06F16/9038 , G06F16/9032
摘要: 本公开涉及计算机技术领域,公开了搜索方法、装置、电子设备及存储介质,该方法包括获取搜索请求,得到搜索关键词;基于搜索关键词对待搜索对象进行搜索,得到第一搜索结果,搜索包括至少一次排序;基于搜索关键词以及待搜索对象的特征进行探索,得到探索结果,待搜索对象的特征包括经过至少一次排序处理后的特征;将探索结果与至少一次排序的结果进行融合,得到融合结果;基于融合结果对待搜索对象进行采样,得到第二搜索结果;基于第二搜索结果对第一搜索结果的排序进行调整,得到对应于搜索请求的目标搜索结果。该方式基于融合结果对待搜索对象进行采样,使得每个待搜索对象具有一定的概率被采样到,从而防止马太效应排序固化。
-
-
-
-