-
公开(公告)号:CN119862151A
公开(公告)日:2025-04-22
申请号:CN202411787497.6
申请日:2024-12-06
Applicant: 中国科学院计算技术研究所
IPC: G06F15/78 , G06F15/173
Abstract: 本发明提供一种基于OAM形态的存算一体计算模组,用于集成不同类型的多个存算一体芯片并实现CPU和存算一体芯片间的通信,所述计算模组对外接口采用OAM协议设计的接口与外部UBB底板连接,计算模组包括:依次层叠连接的电源夹层卡、控制器卡和存算子卡,其中,电源夹层卡被配置为:采用OAM协议设计的电源接口进行电源转换,为控制器卡和存算子卡供电,为控制器卡和外部UBB底板上的CPU之间的数据信号传输提供通路;控制器卡被配置为:进行不同协议间的转换,以及存算子卡与外部UBB底板上的CPU间的通信和数据信号传输;存算子卡被配置为:存储数据信号并为一个或多个存算一体芯片提供芯片连接接口;通过芯片连接接口向与其连接的存算一体芯片传输数据信号。
-
公开(公告)号:CN119322667A
公开(公告)日:2025-01-17
申请号:CN202411367000.5
申请日:2024-09-29
Applicant: 中国科学院计算技术研究所
Abstract: 本发明提出一种面向OODAflow操作系统的容错调度方法和装置,包括:接收智能计算任务并将其拆分为单任务,将单任务与环境健康度监测进程封装成自持的容器,等候计算设备调度;将已封装成自持的容器的单任务部署到相应计算节点;在计算节点执行任务过程中,该环境健康度监测进程实时监测当前计算节点所属计算设备的健康情况,若健康情况有故障,则当前计算节点退出任务并保存checkpoint文件;若无故障,则将任务的执行结果写回共享存储区。本发明提出的容错调度系统实现了对OODAflow操作系统任务的容错机制与高效的容错调度,保障了OODAflow操作系统处理计算任务的实时性与可靠性。
-