查询语句意图识别的方法和装置
    1.
    发明公开

    公开(公告)号:CN118861201A

    公开(公告)日:2024-10-29

    申请号:CN202410873827.7

    申请日:2024-07-01

    摘要: 本发明公开了一种查询语句意图识别的方法和装置,涉及计算机技术领域。该方法的一具体实施方式包括:响应于意图识别请求,对查询语句进行特征提取得到查询向量;将查询向量输入到预测模型中,判断查询语句是否有查询对象意图;在判定查询语句有查询对象意图的情况下,根据查询向量和预设的每个对象的对象特征向量进行低秩化处理和运算,得到每个对象的预测分数;根据设定的分数阈值和每个对象的预测分数得到可选对象集;根据设定的筛选规则从可选对象集中选取目标对象,作为查询语句的意图识别结果。该实施方式提升了系统吞吐量,提升了推理性能;大大减少了计算量,节省了算力;大大减少了传输数据量,减少了数据传输耗时。

    模型更新方法和装置
    2.
    发明公开

    公开(公告)号:CN113821232A

    公开(公告)日:2021-12-21

    申请号:CN202011341953.6

    申请日:2020-11-25

    摘要: 本申请公开了模型更新方法和装置,涉及模型训练技术领域。方法的一具体实施方式包括:响应于确定当前提供服务的模型的全量模型版本号与待更新全量模型版本号一致,检测是否存在与全量模型版本号相对应的增量模型版本顺序表;响应于确定存在增量模型版本顺序表,基于增量模型版本顺序表加载各增量模型以对当前提供服务的模型进行更新。该实施方式有效提升了模型更新的实时性和可靠性。

    推荐对象的召回方法及装置、存储介质、电子设备

    公开(公告)号:CN113781087B

    公开(公告)日:2024-10-22

    申请号:CN202110127220.0

    申请日:2021-01-29

    摘要: 本公开属于计算机技术领域,涉及一种推荐对象的召回方法及装置、存储介质、电子设备。该方法包括:获取历史对象标识,并确定与所述历史对象标识对应的多个待推荐对象标识;其中,所述多个待推荐对象标识通过链式结构关联;按照所述链式结构计算所述历史对象标识和所述多个待推荐对象标识之间的多个待推荐分值;基于所述链式结构,根据所述多个待推荐分值在所述多个待推荐对象标识中确定召回对象标识,以按照所述召回对象标识进行召回。本公开一方面,将链式结构与计算过程有效结合,实现了亿量级对象的高性能个性化召回服务,有效减少了计算次数和计算耗时;另一方面,满足了线上服务高并发、低时延的性能需求,也提高了离线过程中的召回性能。

    模型量化方法及其装置
    4.
    发明公开

    公开(公告)号:CN116415689A

    公开(公告)日:2023-07-11

    申请号:CN202310324730.6

    申请日:2023-03-29

    IPC分类号: G06N20/00 G06N5/04

    摘要: 本申请提出了一种模型量化方法及其装置,涉及数据处理技术领域。该方法包括:获取待量化的源深度学习模型和源深度学习模型的第一模型格式;获取量化后目标深度学习模型所支持的第二模型格式,并在第一模型格式与第二模型格式不一致时,对源深度学习模型进行格式转换,以获取第二模型格式下的第一候选深度学习模型;对第一候选深度学习模型的模型参数进行量化处理,以获取第二候选深度学习模型;对第二候选深度学习模型进行轻量级推理转换,以获取量化后的目标深度学习模型。本申请可以提高模型量化的通用性,适用于多深度学习训练框架生成的不同模型格式的深度学习模型,可以平衡深度学习模型的量化效率以及量化精度,减少内存占用和参数更新。

    模型更新方法及装置、计算机存储介质、电子设备

    公开(公告)号:CN113791798B

    公开(公告)日:2024-06-18

    申请号:CN202010600547.0

    申请日:2020-06-28

    摘要: 本公开涉及人工智能技术领域,提供了一种模型更新方法、模型更新装置、计算机存储介质、电子设备,其中,模型更新方法包括:获取项目对象模型对应的多个拆分模型,以使服务器集群对多个拆分模型进行部署;服务器集群包括多个服务器;当检测到项目对象模型存在更新模型时,获取更新模型对应的更新版本号;将更新版本号发送至服务器集群,以使服务器集群加载更新版本号对应的多个目标模型;当检测到预设数量服务器中的目标模型加载完成时,将项目对象模型的版本号切换为更新版本号。本公开中的方法能够解决相关技术中对单个拆分模型的版本进行异步切换所导致的模型内部版本不一致,模型处理结果误差较大的技术问题,提高模型处理结果的准确性。

    一种产品推荐方法和装置
    8.
    发明公开

    公开(公告)号:CN117453988A

    公开(公告)日:2024-01-26

    申请号:CN202210846271.3

    申请日:2022-07-19

    IPC分类号: G06F16/9535 G06N20/00

    摘要: 本发明公开了一种产品推荐方法和装置,涉及搜索推荐技术领域。该方法的一具体实施方式包括:响应于用户的产品推荐请求,根据用户标识获取待排序产品集合和用户行为数据,并通过用户特征模型对用户行为数据进行处理生成用户特征;根据待排序产品集合获取每个待排序产品的产品特征;根据用户特征和每个待排序产品的产品特征,通过产品排序模型生成产品排序结果;根据产品排序结果,从待排序产品集合中确定不少于一个待推荐产品,并将待推荐产品推荐给用户。该实施方式能够避免用户数据的滞后性,降低产品推荐的计算时间,提高产品推荐的效率,并且无需对用户数据进行压缩,能够对预估模型进行更新,提高了用户特征的准确性和产品推荐的效果。

    相关性评估模型的训练方法和装置

    公开(公告)号:CN118569408A

    公开(公告)日:2024-08-30

    申请号:CN202410719389.9

    申请日:2024-06-05

    摘要: 本公开的实施例公开了相关性评估模型的训练方法和装置。该方法的一具体实施方式包括:获取用户在物品搜索平台上的历史点击行为数据,其中,历史点击行为数据包括历史搜索关键词和历史点击物品信息;基于历史点击行为数据,生成训练样本集;利用训练样本集对基于转换器的模型进行训练,得到相关性评估模型,其中,相关性评估模型用于评估搜索关键词与对应的搜索结果中的每条物品信息的相关性,且相关性预估模型完全基于自注意力机制,在预估单个词语时聚焦输入序列中的所有词语。该实施方式利用基于转换器的模型训练相关性评估模型,提高了模型的预估效果。