-
公开(公告)号:CN113779018B
公开(公告)日:2024-11-15
申请号:CN202010771119.4
申请日:2020-08-03
申请人: 北京沃东天骏信息技术有限公司 , 北京京东世纪贸易有限公司
-
公开(公告)号:CN113779018A
公开(公告)日:2021-12-10
申请号:CN202010771119.4
申请日:2020-08-03
申请人: 北京沃东天骏信息技术有限公司 , 北京京东世纪贸易有限公司
摘要: 本发明公开了数据处理方法和装置,涉及计算机技术领域。该方法的一具体实施方式包括获取消息,识别消息格式;根据消息格式,调用预定义的配置文件得到所述消息对应的字段信息,以生成相应的数据流;基于所述配置文件中预设的返回数据结构,将所述数据流进行转换并返回。从而,本发明的实施方式能够解决现有数据处理方式兼容性差,效率低的问题。
-
公开(公告)号:CN117555885A
公开(公告)日:2024-02-13
申请号:CN202210915038.6
申请日:2022-08-01
申请人: 北京沃东天骏信息技术有限公司 , 北京京东世纪贸易有限公司
IPC分类号: G06F16/215 , G06F16/22 , G06F18/10 , G06F18/214
摘要: 本发明公开了一种数据预处理方法和装置,涉及人工智能技术领域。该方法的一具体实施方式包括:从预设的配置文件中确定待处理的目标数据表以及所述目标数据表中待处理的目标列,将确定的目标列组合为预设的表格型数据结构的第一数据对象;依据所述配置文件生成包括多个键值对数据的第二数据对象;其中,每一键值对数据中的键为一种预处理方式,值为所述配置文件所指示的、各目标数据表中使用该预处理方式的目标列的当前标识的集合;根据每一键值对数据中的预处理方式对应的数据预处理工具对第一数据对象中、该键值对数据指示的目标列执行并行处理,得到数据预处理结果。该实施方式能够减轻预处理过程中的人工工作量耗费,提高模型训练效率。
-
公开(公告)号:CN114579309A
公开(公告)日:2022-06-03
申请号:CN202210208905.2
申请日:2022-03-03
申请人: 北京沃东天骏信息技术有限公司 , 北京京东世纪贸易有限公司
IPC分类号: G06F9/50
摘要: 本发明公开了一种数据处理方法和装置,涉及计算机技术领域。该方法的一具体实施方式包括:接入实时数据流,检测逻辑处理算子所依赖的每个机器的资源使用率,得到资源总使用率;比对资源总使用率和预设使用率范围,使用与比对结果对应的处理策略,调整逻辑处理算子所依赖的每个机器的并行度;利用调整并行度后的逻辑处理算子处理所述实时数据流,将处理结果传输给下一个逻辑处理算子进行再处理,重复上述并行度调整和处理数据过程,直至无逻辑处理算子为止,得到总处理结果。该实施方式随着数据量级的大小和处理速度,自动化调整算子使用资源的并行度,无需数据开发人员调整。
-
公开(公告)号:CN117807444A
公开(公告)日:2024-04-02
申请号:CN202211176749.2
申请日:2022-09-26
申请人: 北京沃东天骏信息技术有限公司 , 北京京东世纪贸易有限公司
IPC分类号: G06F18/22 , G06F18/25 , G06F16/9535 , G06N3/0464 , G06N3/0895
摘要: 本公开的实施例公开了标签生成方法、装置、电子设备、可读介质和产品。该方法的一具体实施方式包括:获取目标用户的用户行为关联信息、用户长期兴趣特征、用户短期兴趣特征和目标物品标签序列;对目标物品标签序列中的目标物品标签进行向量化处理,以生成融合后物品标签向量;基于用户行为关联信息、用户长期兴趣特征、用户短期兴趣特征、融合后物品标签向量和预先训练的用户特征向量生成模型,生成目标用户特征向量;确定目标用户特征向量和候选用户标签向量集合中的每个候选用户标签向量的向量相似度;确定目标用户对应的目标用户标签集合。该实施方式与人工智能有关,实现了用户标签的精准生成。
-
公开(公告)号:CN115730997A
公开(公告)日:2023-03-03
申请号:CN202211486414.0
申请日:2022-11-24
申请人: 北京沃东天骏信息技术有限公司 , 北京京东世纪贸易有限公司
IPC分类号: G06Q30/0601 , G06F16/2457
摘要: 本公开提供一种物品数据处理方法、装置、设备及介质,方法包括:获取待处理物品数据,其中,所述待处理物品数据包括:至少一个用户标识查看的历史物品数据,和与所述历史物品数据匹配的相关物品数据;基于预先设置的物品质量判定方法,确定所述待处理物品数据的质量判定信息;基于所述质量判定信息,从所述待处理物品数据中确定目标物品数据,其中,所述目标物品数据为符合预设质量指标的物品数据。本公开用以解决现有技术中仅关注物品反馈速率,导致用户留存率低的缺陷,实现为用户提供高质量的物品,提高用户的留存率。
-
-
-
-
-