-
公开(公告)号:CN117170879A
公开(公告)日:2023-12-05
申请号:CN202311437174.X
申请日:2023-11-01
Applicant: 之江实验室
IPC: G06F9/50
Abstract: 本申请涉及一种面向智能芯片的设备管理装置和方法,其中,该装置包括信息采集模块,用于获取设备信息;数据存储模块,分别与设备管理模块、用于存储设备信息、智能芯片加速卡资源调度信息和设置信息;设备设置模块,用于对设备的目标参数进行设置;资源监控模块,用于监控设备的运行情况和智能芯片加速卡资源的使用情况;设备管理模块,用于调度智能芯片加速卡资源。通过本申请,解决了传统的设备管理装置对于智能芯片加速卡资源的利用效率较低问题,提高了加速卡资源的利用效率。
-
公开(公告)号:CN117093352A
公开(公告)日:2023-11-21
申请号:CN202311328291.2
申请日:2023-10-13
Applicant: 之江实验室
Abstract: 本说明书公开了一种基于模板的计算集群作业调度系统及方法、装置,通过在不同的计算集群中部署不完全相同的计算框架,当监测到用户的选择操作后,确定用户执行作业时需调用的目标框架,并向用户展示该目标框架对应的作业调用模板,再根据用户对该作业调用模板的输入操作,确定用户的输入数据,再将该输入数据和该目标作业调用模板进行组合,生成目标作业,最后将该目标作业下发至部署有该目标框架的目标集群中。从上述内容可以看出,本方法仅需要用户确定自身需执行的计算作业的作业类型,而不需要用户根据执行该计算作业的计算框架和对应计算集群的特点编写作业启动程序,提高了作业生成的效率和作业处理的效率。
-
-
公开(公告)号:CN116501474B
公开(公告)日:2023-09-22
申请号:CN202310676088.8
申请日:2023-06-08
Applicant: 之江实验室
Abstract: 本说明书公开了一种批量同质任务的处理系统、方法以及装置,调度节点生成批量同质任务,并根据各计算集群分别对应的负载,将该批量同质任务下发至各计算集群,由各计算集群执行该批量同质任务。在批量同质任务的任务量过大时,可调用多个计算集群来协同处理同一批量同质任务,减少了批量同质任务的处理时间,保证了处理效率。
-
公开(公告)号:CN116501474A
公开(公告)日:2023-07-28
申请号:CN202310676088.8
申请日:2023-06-08
Applicant: 之江实验室
Abstract: 本说明书公开了一种批量同质任务的处理系统、方法以及装置,调度节点生成批量同质任务,并根据各计算集群分别对应的负载,将该批量同质任务下发至各计算集群,由各计算集群执行该批量同质任务。在批量同质任务的任务量过大时,可调用多个计算集群来协同处理同一批量同质任务,减少了批量同质任务的处理时间,保证了处理效率。
-
公开(公告)号:CN115268877B
公开(公告)日:2022-12-13
申请号:CN202211177798.8
申请日:2022-09-27
Applicant: 之江实验室
Abstract: 本发明公开了一种用于图计算并行执行的中间表示方法及装置,包括以下步骤:步骤S1:将神经网络编译为计算图;步骤S2:定义计算图中张量变量的分支状态;步骤S3:定义计算图中张量变量的数据依赖关系;步骤S4:定义计算图中张量变量的控制依赖关系;步骤S5:构建计算图中张量变量的数据依赖关系图;步骤S6:构建计算图中张量变量的控制依赖关系图;步骤S7:将控制依赖转换为数据依赖。本发明从全局角度分析计算图执行过程中计算图中不同分支线程的张量变量之间的依赖关系以及基于依赖关系推导全局计算图中可并行执行分支线程的并行计算方法,通过分析计算图执行过程中不同分支线程的张量变量之间的依赖关系,优化计算图的编译效率。
-
公开(公告)号:CN115242660B
公开(公告)日:2022-12-13
申请号:CN202211149183.4
申请日:2022-09-21
Applicant: 之江实验室
Abstract: 本发明公开了基于中心化的异构算力联邦系统及组网和执行方法,其中所述异构算力联邦系统架构总体上分为2层:视图层和资源层。在视图层包含2个模块:异构算力联邦服务模块和异构算力联邦控制模块;在资源层中包含2个模块:异构算力集群管理模块和异构算力联邦探针模块。根据上述架构,异构算力集群进行组网:首先在在异构算力集群管理模块部署异构算力联邦探针模块;然后在异构算力联邦控制模块创建异构算力集群描述模型;之后异构算力联邦探针模块收集异构算力集群信息推送到异构算力联邦控制模块;最后由异构算力联邦控制模块填充异构算力集群资源描述模型,完成异构算力联邦系统的统一算力视图。
-
公开(公告)号:CN115237608A
公开(公告)日:2022-10-25
申请号:CN202211149154.8
申请日:2022-09-21
Applicant: 之江实验室
Abstract: 本发明公开了一种基于多集群统一算力的多模式调度系统和方法,系统包括多集群资源管理模块、多集群调度策略模块、资源监控报警模块;本发明首先根据作业申请的资源情况,并结合当前所有集群可分配的资源对集群进行过滤,过滤出符合条件的集群;然后再根据作业期望的调度策略从符合条件的集群中选择出最优的集群;之后会对选择的集群资源进行占用,同时也会刷新多集群资源视图;最后,在作业执行完成后,会释放作业占用的集群资源,也将再次刷新多集群资源视图,本发明基于多集群统一算力的统一管控,通过双向资源收集来确保多集群资源视图的准确性和实时性,为用户作业选择最优的调度集群。
-
公开(公告)号:CN115237581A
公开(公告)日:2022-10-25
申请号:CN202211148225.2
申请日:2022-09-21
Applicant: 之江实验室
Abstract: 本发明属于智能计算技术领域,涉及一种面向异构算力的多策略智能调度方法和装置,该方法包括:步骤一,基于计算集群的异构性、计算任务的差异和用户需求,设定任务的执行策略,采用强化学习方法并结合所述执行策略,构建马尔可夫决策过程模型;步骤二,基于构建的马尔可夫决策过程模型,采用近端策略优化算法求解用户计算任务的最优任务调度策略;步骤三,基于最优任务调度策略,将任务调度到所对应的集群上执行。本发明是通过强化学习的方法,以用户为中心设计异构算力构建多策略的调度方法,能根据不同算力中心异构算力集群的状态自学习式地找出最优任务调度方案,从而以成本划算的方式提升算力的利用率,满足用户计算任务的需求。
-
-
-
-
-
-
-
-