协同处理方法及装置
    1.
    发明公开

    公开(公告)号:CN118139110A

    公开(公告)日:2024-06-04

    申请号:CN202211541199.X

    申请日:2022-12-02

    IPC分类号: H04W28/08 H04L67/10

    摘要: 本申请公开了一种协同处理方法及装置,属于核心网技术领域。本申请实施例的协同处理方法,应用于核心网控制单元,包括:接收移动终端发送的深度神经网络DNN模型推理任务的请求,所述DNN模型推理任务的请求包括DNN模型描述信息和任务服务质量QoS需求信息;将所述DNN模型推理任务分割为多个子任务,选择最优的多个计算转发节点,将所述多个子任务分配给所述多个计算转发节点;向所述移动终端发送所述DNN模型的分割策略和计算转发节点的调度策略;向所述计算转发节点发送所述计算转发节点的调度和路由转发策略。本申请实施例能够实现AI推理任务的高效推理执行,满足任务低时延需求。

    一种业务处理、装置及设备
    4.
    发明公开

    公开(公告)号:CN116226505A

    公开(公告)日:2023-06-06

    申请号:CN202111478479.6

    申请日:2021-12-06

    IPC分类号: G06F16/9535

    摘要: 本发明提供一种业务处理、装置及设备,涉及无线通信技术领域。该方法包括:获取待选终端设备集合中各个终端的设备状态信息,所述设备状态信息用于指示所述终端是否能被访问所述终端为对网络设备发起的目标寻呼进行响应的终端,且所述目标寻呼是与目标用户的目标业务对应的寻呼;根据所述设备状态信息和所述目标用户的用户偏好信息,确定承载所述目标业务的目标终端,所述用户偏好信息用于指示用户对至少一个终端的偏好程度。

    模型管理方法、装置、设备及存储介质

    公开(公告)号:CN118101504A

    公开(公告)日:2024-05-28

    申请号:CN202211505220.0

    申请日:2022-11-28

    IPC分类号: H04L41/5051 G06N20/00

    摘要: 本发明公开了一种模型管理方法、装置、设备及存储介质。其中,所述方法包括:接收第一请求;所述第一请求用于请求获取满足要求的第一模型;所述要求是所述第一模型满足第一属性、第二属性和第三属性;所述第一属性表征所述第一模型作用的对象;所述第二属性表征所述第一模型所达到的预期效果;所述第三属性表征所述第一模型所满足的性能需求;响应所述第一请求,确定满足所述要求的第一模型;将所述第一模型发出。

    数据处理方法、装置、电子设备及存储介质

    公开(公告)号:CN118828996A

    公开(公告)日:2024-10-22

    申请号:CN202311353688.7

    申请日:2023-10-18

    发明人: 李唯源

    IPC分类号: H04W76/10 H04W12/06 H04W28/08

    摘要: 本申请提供了一种数据处理方法、装置、电子设备及存储介质,涉及技术领域为:互联网技术领域,方法包括:接收数据请求节点发送的数据请求;其中,数据请求中包括:请求类型信息;基于请求类型信息确定数据请求的请求检测结果;其中,请求检测结果用于表征数据请求是否为非通信会话类请求;若请求检测结果表征数据请求为非通信会话类请求,则基于数据请求节点的位置及标识信息将数据请求转发给第一网络功能节点,供第一网络功能节点针对数据请求进行处理;其中,第一网络功能节点用于进行数据控制或数据编排调度。本申请实施例中,可以实现在现有通信网络的“管道”中有效的针对非通信会话类数据进行处理或响应。

    面向AI大模型分割的多节点分配调度方法及装置

    公开(公告)号:CN117971445A

    公开(公告)日:2024-05-03

    申请号:CN202211310084.X

    申请日:2022-10-25

    发明人: 李唯源

    IPC分类号: G06F9/50 G06F9/48

    摘要: 本发明提供了一种面向AI大模型分割的多节点分配调度方法及装置,属于人工智能技术领域。包括:接收算力转发节点发送的算力信息和拓扑信息;接收用户发送的计算任务请求信息;根据计算任务请求信息和算力可用量对计算任务进行分解,将可用的算力转发节点的标识发送给算力调度功能,以使算力调度功能确定节点顺序并将节点顺序发送给算力转发节点;接收算力调度功能发送的节点顺序,根据节点顺序确定模型分割位置,并将分解后的模型结构分别发送给相应的算力转发节点;通知用户计算任务已响应,以使用户进行模型的初始运算,并将输出的参数封装到报文中转发至算力转发节点中的接入节点。本发明的技术方案能够减少端到端的时延。