模型量化方法及其装置
    2.
    发明公开

    公开(公告)号:CN116415689A

    公开(公告)日:2023-07-11

    申请号:CN202310324730.6

    申请日:2023-03-29

    IPC分类号: G06N20/00 G06N5/04

    摘要: 本申请提出了一种模型量化方法及其装置,涉及数据处理技术领域。该方法包括:获取待量化的源深度学习模型和源深度学习模型的第一模型格式;获取量化后目标深度学习模型所支持的第二模型格式,并在第一模型格式与第二模型格式不一致时,对源深度学习模型进行格式转换,以获取第二模型格式下的第一候选深度学习模型;对第一候选深度学习模型的模型参数进行量化处理,以获取第二候选深度学习模型;对第二候选深度学习模型进行轻量级推理转换,以获取量化后的目标深度学习模型。本申请可以提高模型量化的通用性,适用于多深度学习训练框架生成的不同模型格式的深度学习模型,可以平衡深度学习模型的量化效率以及量化精度,减少内存占用和参数更新。

    一种模型训练、信息确定方法、装置、设备和存储介质

    公开(公告)号:CN117333235A

    公开(公告)日:2024-01-02

    申请号:CN202311434363.1

    申请日:2023-10-31

    摘要: 本申请实施例公开了一种模型训练方法,包括:获取样本用户的操作行为对应的样本基本信息和样本相关信息,以及样本用户的样本操作行为信息;样本基本信息至少表征样本用户的用户信息和操作行为对应的样本操作对象的信息;样本相关信息表征与样本操作对象和操作行为相关的信息;对样本基本信息进行处理得到第一特征信息,并对样本相关信息进行处理得到第二特征信息;对样本操作行为信息进行处理得到第三特征信息;第三特征信息表征样本用户的兴趣特征信息;基于第一特征信息、第二特征信息和第三特征信息对初始点击率预估模型进行模型训练,得到目标点击率预估模型。本申请实施例还公开了一种信息确定方法、装置、设备和存储介质。

    模型更新方法及装置、计算机存储介质、电子设备

    公开(公告)号:CN113791798A

    公开(公告)日:2021-12-14

    申请号:CN202010600547.0

    申请日:2020-06-28

    摘要: 本公开涉及人工智能技术领域,提供了一种模型更新方法、模型更新装置、计算机存储介质、电子设备,其中,模型更新方法包括:获取项目对象模型对应的多个拆分模型,以使服务器集群对多个拆分模型进行部署;服务器集群包括多个服务器;当检测到项目对象模型存在更新模型时,获取更新模型对应的更新版本号;将更新版本号发送至服务器集群,以使服务器集群加载更新版本号对应的多个目标模型;当检测到预设数量服务器中的目标模型加载完成时,将项目对象模型的版本号切换为更新版本号。本公开中的方法能够解决相关技术中对单个拆分模型的版本进行异步切换所导致的模型内部版本不一致,模型处理结果误差较大的技术问题,提高模型处理结果的准确性。

    基于预训练模型的模型改进方法及装置

    公开(公告)号:CN112308205A

    公开(公告)日:2021-02-02

    申请号:CN202010597363.3

    申请日:2020-06-28

    IPC分类号: G06N3/04 G06N3/08 G06N20/00

    摘要: 本申请公开了一种基于预训练模型的模型改进方法及装置。方法的一具体实施方式包括:获取相匹配的主体模型、至少一个拆分模型的拆分配置信息,其中,主体模型、至少一个拆分模型基于预训练模型拆分得到,被分布式部署于不同的预设设备,拆分配置信息表征主体模型和至少一个拆分模型的属性信息;根据拆分配置信息,建立主体模型与至少一个拆分模型之间的联系,以供主体模型在运行过程中与至少一个拆分模型进行数据交互。本实施方式可以将原有的大规模的预训练模型拆分为较小规模的主体模型和至少一个拆分模型,降低主体模型和至少一个拆分模型对设备的部署要求,提高了大规模的预训练模型的实用性。

    模型更新方法和装置
    6.
    发明授权

    公开(公告)号:CN113821232B

    公开(公告)日:2024-06-18

    申请号:CN202011341953.6

    申请日:2020-11-25

    摘要: 本申请公开了模型更新方法和装置,涉及模型训练技术领域。方法的一具体实施方式包括:响应于确定当前提供服务的模型的全量模型版本号与待更新全量模型版本号一致,检测是否存在与全量模型版本号相对应的增量模型版本顺序表;响应于确定存在增量模型版本顺序表,基于增量模型版本顺序表加载各增量模型以对当前提供服务的模型进行更新。该实施方式有效提升了模型更新的实时性和可靠性。

    用于推送信息的方法、装置、设备以及存储介质

    公开(公告)号:CN113779375A

    公开(公告)日:2021-12-10

    申请号:CN202110232887.7

    申请日:2021-03-03

    IPC分类号: G06F16/9535 G06F16/901

    摘要: 本申请公开了用于推送信息的方法、装置、设备以及存储介质,涉及分布式技术领域。具体实现方案为:获取图数据以及图数据的元数据;获取多个数据分片;根据元数据,将多个数据分片中的至少一个数据分片融合到图数据中,得到更新的图数据;根据更新的图数据,确定目标信息进行推送。本实现方式可以及时地更新图数据,并加载更新,从而为信息推送服务提供有效的数据,提高推送的信息与用户的贴合度。

    模型更新方法及装置、计算机存储介质、电子设备

    公开(公告)号:CN113791798B

    公开(公告)日:2024-06-18

    申请号:CN202010600547.0

    申请日:2020-06-28

    摘要: 本公开涉及人工智能技术领域,提供了一种模型更新方法、模型更新装置、计算机存储介质、电子设备,其中,模型更新方法包括:获取项目对象模型对应的多个拆分模型,以使服务器集群对多个拆分模型进行部署;服务器集群包括多个服务器;当检测到项目对象模型存在更新模型时,获取更新模型对应的更新版本号;将更新版本号发送至服务器集群,以使服务器集群加载更新版本号对应的多个目标模型;当检测到预设数量服务器中的目标模型加载完成时,将项目对象模型的版本号切换为更新版本号。本公开中的方法能够解决相关技术中对单个拆分模型的版本进行异步切换所导致的模型内部版本不一致,模型处理结果误差较大的技术问题,提高模型处理结果的准确性。

    一种产品推荐方法和装置
    10.
    发明公开

    公开(公告)号:CN117453988A

    公开(公告)日:2024-01-26

    申请号:CN202210846271.3

    申请日:2022-07-19

    IPC分类号: G06F16/9535 G06N20/00

    摘要: 本发明公开了一种产品推荐方法和装置,涉及搜索推荐技术领域。该方法的一具体实施方式包括:响应于用户的产品推荐请求,根据用户标识获取待排序产品集合和用户行为数据,并通过用户特征模型对用户行为数据进行处理生成用户特征;根据待排序产品集合获取每个待排序产品的产品特征;根据用户特征和每个待排序产品的产品特征,通过产品排序模型生成产品排序结果;根据产品排序结果,从待排序产品集合中确定不少于一个待推荐产品,并将待推荐产品推荐给用户。该实施方式能够避免用户数据的滞后性,降低产品推荐的计算时间,提高产品推荐的效率,并且无需对用户数据进行压缩,能够对预估模型进行更新,提高了用户特征的准确性和产品推荐的效果。