-
公开(公告)号:CN115495312A
公开(公告)日:2022-12-20
申请号:CN202211182518.2
申请日:2022-09-27
申请人: 北京百度网讯科技有限公司
摘要: 本公开提供了一种业务请求处理方法和装置,涉及人工智能技术领域,具体涉及数据处理、机器学习技术领域。具体实现方案为:对接收到的第一业务请求进行预处理,并将预处理得到的预处理数据写入到第一内存空间中,在监听到第二内存空间中存在第二处理器对预处理数据的处理结果之前,如果接收到第二业务请求,则继续对该第二业务请求进行预处理,并在监听到第二内存空间中存在第二处理器对预处理数据的处理结果的情况下,对第二内存空间中的处理结果进行后处理,以得到对应的请求结果。由此,提高了计算资源的利用率。
-
公开(公告)号:CN115604144B
公开(公告)日:2024-07-12
申请号:CN202211185800.6
申请日:2022-09-27
申请人: 北京百度网讯科技有限公司
摘要: 本公开提供了一种测试方法及装置、电子设备和存储介质,涉及人工智能技术领域,尤其涉及云服务、云原生、微服务等技术领域。实现方案为:接收第一测试请求,第一测试请求包括用于测试被测服务的目标测试任务的信息;响应于第一设备拒绝执行目标测试任务,或者,第一设备同意执行目标测试任务且执行目标测试任务所需的测试设备的第一数量大于1,基于第一测试请求生成至少一个第二测试请求;以及将至少一个第二测试请求分别转发给至少一个第二设备,以便至少一个第二设备中的每个第二设备对相应的第二测试请求进行响应,至少一个第二设备中的每个第二设备为分布式测试系统中的除第一设备以外的任一测试设备。
-
公开(公告)号:CN115562962A
公开(公告)日:2023-01-03
申请号:CN202211195746.3
申请日:2022-09-28
申请人: 北京百度网讯科技有限公司
摘要: 本公开提供了一种模型推理性能的分析方法、装置及电子设备,涉及人工智能技术领域,尤其涉及深度学习及模型推理等技术领域。具体实现方案为:确定待分析模型;接收第一输入,并获取所述第一输入中的目标信息,所述目标信息包括插桩代码的位置信息或针对预先嵌入的性能分析器的启动指令;基于所述目标信息执行对所述待分析模型的推理性能分析,并生成分析结果文件。
-
公开(公告)号:CN115495312B
公开(公告)日:2023-07-18
申请号:CN202211182518.2
申请日:2022-09-27
申请人: 北京百度网讯科技有限公司
摘要: 本公开提供了一种业务请求处理方法和装置,涉及人工智能技术领域,具体涉及数据处理、机器学习技术领域。具体实现方案为:对接收到的第一业务请求进行预处理,并将预处理得到的预处理数据写入到第一内存空间中,在监听到第二内存空间中存在第二处理器对预处理数据的处理结果之前,如果接收到第二业务请求,则继续对该第二业务请求进行预处理,并在监听到第二内存空间中存在第二处理器对预处理数据的处理结果的情况下,对第二内存空间中的处理结果进行后处理,以得到对应的请求结果。由此,提高了计算资源的利用率。
-
公开(公告)号:CN115604144A
公开(公告)日:2023-01-13
申请号:CN202211185800.6
申请日:2022-09-27
申请人: 北京百度网讯科技有限公司(CN)
摘要: 本公开提供了一种测试方法及装置、电子设备和存储介质,涉及人工智能技术领域,尤其涉及云服务、云原生、微服务等技术领域。实现方案为:接收第一测试请求,第一测试请求包括用于测试被测服务的目标测试任务的信息;响应于第一设备拒绝执行目标测试任务,或者,第一设备同意执行目标测试任务且执行目标测试任务所需的测试设备的第一数量大于1,基于第一测试请求生成至少一个第二测试请求;以及将至少一个第二测试请求分别转发给至少一个第二设备,以便至少一个第二设备中的每个第二设备对相应的第二测试请求进行响应,至少一个第二设备中的每个第二设备为分布式测试系统中的除第一设备以外的任一测试设备。
-
公开(公告)号:CN116204321A
公开(公告)日:2023-06-02
申请号:CN202310266149.3
申请日:2023-03-17
申请人: 北京百度网讯科技有限公司
摘要: 本公开提供了一种模型获取、模型部署方法、装置、设备和介质,涉及人工智能领域,尤其涉及深度学习、云计算、大数据领域。具体实现方案为:该模型处理方法包括:获取原始模型对应的包含模型描述信息的原始图描述文件;采用预设切分规则对所述原始图描述文件进行切分处理,获取若干切分后的子图描述文件;其中,所述预设切分规则包括若干预设约束条件,若干所述预设约束条件用于针对每个所述子图描述文件中子图包含的不同模型算子,均衡不同的所述模型算子之间的资源要求达到预设均衡条件;根据每个所述子图描述文件获取所述原始模型对应的若干子模型。
-
公开(公告)号:CN116192670A
公开(公告)日:2023-05-30
申请号:CN202310117872.5
申请日:2023-02-02
申请人: 北京百度网讯科技有限公司
IPC分类号: H04L41/16 , H04L41/0823 , H04L41/0233 , H04L41/0246 , H04L41/12 , G06F8/30
摘要: 本公开提供了一种环境部署方法、装置、设备及介质,涉及人工智能领域,具体涉及云平台技术和资源分配技术领域。具体实现方案为:获取基于通用语言编写的环境配置信息,所述环境配置信息用于确定目标环境的上下文;通过与所述通用语言对应的通用语言解析器,将所述环境配置信息转换得到所述目标环境的元信息;根据所述目标环境的元信息,生成所述目标环境的数据包;获取所述目标环境的资源配置信息,所述资源配置信息用于为所述目标环境分配运行所需的资源;根据所述目标环境的数据包和资源配置信息,在指定的环境中构建所述目标环境,其中,所述目标环境中用于运行人工智能应用。本公开实施例可以提高环境部署效率。
-
公开(公告)号:CN118228827A
公开(公告)日:2024-06-21
申请号:CN202410324021.2
申请日:2024-03-20
申请人: 北京百度网讯科技有限公司
IPC分类号: G06N5/04
摘要: 本公开提供了一种基于大模型技术的模型服务提供方法、平台及电子设备,涉及计算机技术领域,尤其涉及大模型技术领域。具体实现方案为:创建待部署的第一服务模型的第一模型实例;为第一模型实例分配推理服务;调用第一模型实例所分配的推理服务的加载接口,为所分配推理服务中封装的基座模型挂载第一服务模型的权重文件;响应于针对目标服务模型的用户请求,从目标服务模型的模型实例中,确定用于响应用户请求的目标模型实例;调用目标模型实例被分配的目标推理服务,以使用所配置计算资源,在目标模型实例中运行挂载目标权重文件后的基座模型,获得用户请求的请求结果。应用本公开实施例提供的模型服务提供方案能够有效利用计算资源。
-
公开(公告)号:CN115480920A
公开(公告)日:2022-12-16
申请号:CN202211143751.X
申请日:2022-09-20
申请人: 北京百度网讯科技有限公司
摘要: 本公开涉及人工智能技术领域,尤其涉及容器技术领域,具体涉及AI服务请求的处理方法、装置、电子设备及存储介质。具体实现方案为:获取AI服务请求;获取AI服务请求相关的AI服务进程的状态;AI服务进程的状态包括:工作状态或回收状态;响应于AI服务进程的状态为工作状态,通过AI服务进程对AI服务请求进行处理;响应于AI服务进程的状态为回收状态,将AI服务进程的状态由回收状态调整至工作状态后,通过AI服务进程对AI服务请求进行处理。本公开可以对调用不频繁的AI服务进程进行回收,AI服务进程可以在需要处理相应的AI服务请求时被快速唤醒,避免AI服务进程占据大量资源,实现了平台资源利用率的提升和服务启动时可用性的提高。
-
-
-
-
-
-
-
-