算力网络中时延约束多路径算力路由方法

    公开(公告)号:CN117880165A

    公开(公告)日:2024-04-12

    申请号:CN202311789759.8

    申请日:2023-12-23

    IPC分类号: H04L45/00 H04L45/12

    摘要: 本发明公开了一种算力网络中时延约束多路径算力路由方法,包括以下步骤:构造面向算力网络的虚拟网络模型,通过增加虚拟节点作为终点,把计算能力映射为算力所在节点与虚拟节点之间的链路能力。把虚拟网络模型中多路径算力路由问题的最大时延约束近似成总时延约束,获得总时延约束下的近似优化结果。在保证最大时延约束条件下,在最大单位数据量成本路径和最小单位数据量成本路径间进行数据量转移。提出的多路径算力路由算法能够解决用于计算的算力资源和用于传输的网络路径的共同选择问题获得近似最优总成本且满足最大时延限制。本发明可以用于算力网络中对时延敏感计算任务进行多路径算力路由。

    算力网络中面向低时延任务的MapReduce混合编码方法

    公开(公告)号:CN116155906A

    公开(公告)日:2023-05-23

    申请号:CN202211671947.6

    申请日:2022-12-25

    IPC分类号: H04L67/101 H04L67/63

    摘要: 本发明公开了一种算力网络中面向低时延任务的MapReduce混合编码方法,包括以下步骤:对于算力网络中的计算任务,获取基于MapReduce框架的服务器的数量、输出任务结果的数量、服务器的计算能力、完成Map阶段计算的服务器数量、传输速率和Map阶段计算时延分布的范围参数,为了获得极大距离可分编码参数和重复冗余度,对时延最小化优化问题进行近似,并迭代运用拉格朗日乘子法和梯度法求解近似问题得到近似值,来更新迭代值,直到满足终止条件结束迭代。用低复杂度方法得到的极大距离可分编码参数和重复冗余度可以使算力网络中低时延的MapReduce任务的总时延近似最小。本发明可以用于对算力网络中的有低时延需求的MapReduce任务进行混合编码,以获得低时延。

    基于SDN&IXP的流量交换平台

    公开(公告)号:CN116800615B

    公开(公告)日:2024-10-22

    申请号:CN202211730732.7

    申请日:2022-12-31

    IPC分类号: H04L41/0895 H04L67/10

    摘要: 本发明提供一种基于SDN&IXP的流量交换平台及配置方法,所述交换网络平台用于实现各区域企业构建对等互联以及多云互联的交换中心网络;所述交换网络平台包括:控制台,用于接收用户输入的用于进行网络配置的需求信息;编排器,用于根据所述需求信息确定控制策略及控制策略对应的节点;控制器,用于根据所述编排器发送的控制策略及控制策略对应的节点,进行网络自动配置;网络设备,用于部署所述节点;交换机、路由器或服务器,以实现所述控制器配置的网络支持不同接入属性的业务。上述交换平台提供的系统和方法,解决了设备配置复杂的问题,简化业务开通流程。可帮助企业快速接入交换中心,构建互联互通。

    一种用于白盒交换机的算力路由方法

    公开(公告)号:CN118449897A

    公开(公告)日:2024-08-06

    申请号:CN202410584739.5

    申请日:2024-05-13

    IPC分类号: H04L45/00 H04L45/02

    摘要: 本发明公开了一种用于白盒交换机的算力路由方法。本发明旨在网络交换机的基础功能上,加入算力路由模块,实现基于计算能力优化的路由机制。首先通过监听网卡的状态,并将网络芯片捕获的算力路由信息写入到交换机数据库中,数据库将相关的信息发布给业务进程,业务进程从数据库获得算力路由信息后重新计算路由,并更新路由表项,从而实现算力路由。通过引入算力路由,可以最大限度地利用网络中各个节点的计算资源,提高资源利用率。这种优化能力使得网络能够在保证性能的前提下,更加高效地利用有限的资源,降低网络运营成本;为分布式计算和边缘计算提供了重要支持。

    基于交换中心业务的软件定义控制器及控制方法和应用

    公开(公告)号:CN116170489B

    公开(公告)日:2023-09-19

    申请号:CN202211730726.1

    申请日:2022-12-31

    摘要: 本发明提供一种基于交换中心业务的软件定义控制器及控制方法和应用。软件定义控制器包括:应用层、编排调度层、原子能力层、能力激活层、资源层。其中,应用层,通过API服务网关接收来源运营门户的客户订单审核后的配置工单,加载参数匹配预置的应用模型;编排调度层,通过原子能力建模工具事先预置各类业务场景的应用模型,用于匹配工单关联的业务模型后进行业务实例化执行,使用流程引擎按照流程对软硬件网络资源参数调度分配及网络配置原子能力的下发。本发明可提供快速建网能力和面向交换中心典型业务的一键开通能力,为接入企业提供快捷服务和优质体验的同时,搭配低成本网络架构规划方案,可显著降低交换中心建设和运维成本。

    针对异构GPU显卡的大语言模型分布式流水并行微调方法

    公开(公告)号:CN118796455A

    公开(公告)日:2024-10-18

    申请号:CN202410772174.3

    申请日:2024-06-16

    IPC分类号: G06F9/50 G06N3/084

    摘要: 本发明属于自然语言处理技术领域,公开了一种针对异构GPU显卡的大语言模型分布式流水并行微调方法,基于多任务微调系统同时对多个LoRA模型实现微调;每个LoRA模型切分为多个部分,分布在相应数量的GPU上,并对GPU进行排序;依据用户请求,通过任务配置模块生成多个任务,并将每个任务划分为若干训练批次;按照每个任务的训练批次顺序,通过任务动态调度器结合动态调度策略生成调度方案;按照GPU正序,将调度方案发送给相应GPU上的多任务训练模块,对所有LoRA模型进行训练。本发明采用精细的模型切分和分配策略、流水线优化路径和任务负载平衡策略,能够更有效地利用多机多卡环境的计算资源,提高微调过程的整体效率,减少资源的浪费。

    算力网络中面向低时延任务的MapReduce混合编码方法

    公开(公告)号:CN116155906B

    公开(公告)日:2024-03-12

    申请号:CN202211671947.6

    申请日:2022-12-25

    IPC分类号: H04L67/101 H04L67/63

    摘要: 本发明公开了一种算力网络中面向低时延任务的MapReduce混合编码方法,包括以下步骤:对于算力网络中的计算任务,获取基于MapReduce框架的服务器的数量、输出任务结果的数量、服务器的计算能力、完成Map阶段计算的服务器数量、传输速率和Map阶段计算时延分布的范围参数,为了获得极大距离可分编码参数和重复冗余度,对时延最小化优化问题进行近似,并迭代运用拉格朗日乘子法和梯度法求解近似问题得到近似值,来更新迭代值,直到满足终止条件结束迭代。用低复杂度方法得到的极大距离可分编码参数和重复冗余度可以使算力网络中低时延的MapReduce任务的总时延近似最小。本发明可以用于对算力网络中的有低时延需求的MapReduce任务进行混合编码,以获得低时延。

    面向算力网络中异构算力资源的时延约束调度方法

    公开(公告)号:CN116916393A

    公开(公告)日:2023-10-20

    申请号:CN202310774167.2

    申请日:2023-06-28

    IPC分类号: H04W28/18 H04W28/20 H04W24/02

    摘要: 本发明公开了一种面向算力网络中异构算力资源的时延约束调度方法,属于通信领域。它包括以下步骤:获取计算任务的数量、数据量、计算量和时延约束,获取异构算力服务器的性能参数,获取通信信道的传输带宽和传输功率。遵循对通信和计算进行联合调度优化总能耗的基本思想,对调度策略和服务器性能参数进行交替迭代优化:一方面固定调度策略,利用动态电压频率缩放技术优化服务器性能参数配置;另一方面固定服务器性能参数,利用投影梯度法优化更新调度策略。调度方法可提供能量优化的异构算力资源调度策略与服务器性能参数配置。本发明可以用于算力网络中异构算力资源的调度优化,以获得降低在时延约束下完成计算任务的能量消耗的有益效果。

    一种跨数据中心网络的超低时延保障及资源调度方法

    公开(公告)号:CN118555256A

    公开(公告)日:2024-08-27

    申请号:CN202410564164.0

    申请日:2024-05-08

    摘要: 本发明公开了一种跨数据中心网络的超低时延保障及资源调度方法,首次提出了考虑多跳交换机之间资源预留公平性的资源分配方法和考虑单个交换机中最坏转发情况下满足超低排队时延保障的资源预留机制以及相应的交换机调度机制。当一个流任务请求到来时,控制器首先根据数据流的流量规范参数计算出每个交换机需要的预留的最低带宽资源,再根据本发明中提出的交换机调度机制判断在该资源预留情况下能否满足用户对于流的超低时延需求,若不能满足,则根据比例公平原则在每个交换机中预留更多的资源。这种基于比例公平的资源预留分配算法能够满足跨数据中心网络对于超低时延通信的需求,并且能够使网络能够承担更多的确定性超低时延流。