-
公开(公告)号:CN119963402A
公开(公告)日:2025-05-09
申请号:CN202510433888.6
申请日:2025-04-08
Applicant: 浪潮(北京)电子信息产业有限公司
Abstract: 本发明公开了一种图像列化器及电子设备,涉及人工智能技术领域。其中,图像列化器通过输入端接收读写控制参数和原始特征数据,利用读写控制模块基于读写控制参数确定数据写入方式和数据读取方式,将原始特征数据按照数据写入方式写入至数据存储模块;在数据读取方式的控制下,按照卷积操作行为方式从数据存储模块读取相应数据,生成特征矩阵数据,并将其通过输出端进行输出。本发明可以解决相关技术的im2col操作存在大量重复数据的问题,有效降低内存和数据传输开销,有效降低通信延迟,提高人工智能任务执行效率,进而有效降低人工智能任务所需的内存资源和计算资源。
-
公开(公告)号:CN119884332A
公开(公告)日:2025-04-25
申请号:CN202510387245.2
申请日:2025-03-31
Applicant: 浪潮(北京)电子信息产业有限公司
IPC: G06F16/3329 , G06N5/04 , G06F9/50
Abstract: 本发明公开了一种应答信息生成方法、设备、介质及计算机程序产品,涉及人工智能技术领域,针对预训练语言模型的并行推理计算的一个批次中,根据所在设备执行预填充任务的算力利用率确定预填充任务的词元预算数量和解码任务的词元预算数量,使解码任务的词元预算数量占比与预填充任务的算力利用率成负相关,根据该根据词元预算数量将对应的待处理序列输入预训练语言模型进行并行推理计算,使得并行推理计算获得吞吐量和延迟的均衡,从而可以解决相关技术中并行推理调度中存在的设备压力与生成性能矛盾的问题,达到提升预训练语言模型的并行推理性能的技术效果,提升了人工智能问答任务的执行性能。
-
公开(公告)号:CN119883975A
公开(公告)日:2025-04-25
申请号:CN202510380285.4
申请日:2025-03-28
Applicant: 浪潮(北京)电子信息产业有限公司
Abstract: 本发明公开了一种数据传输方法、设备、介质及计算机程序产品,涉及计算机技术,通过将主机内存的内存区域硬件入口内存表和内存转换区域表存储于第一设备本地,第一设备在执行主机的远程直接内存访问的数据传输任务进行主机内存和本地存储之间的数据搬移时,无需到主机中查表确定目标内存的物理地址,而是通过识别目标内存的标识和目标内存的目标虚拟地址,根据目标虚拟地址查询内存转换区域表得到目标物理地址,此时才需调用第一总线访问主机内存,以执行主机内存与第一设备的本地存储之间的数据搬移,可以解决现今远程直接内存访问过程出现的通信瓶颈,达到了提高远程直接内存访问的通信效率的技术效果。
-
公开(公告)号:CN119052199A
公开(公告)日:2024-11-29
申请号:CN202411247080.0
申请日:2024-09-06
Applicant: 浪潮(北京)电子信息产业有限公司
IPC: H04L49/10 , H04L49/109 , H04L49/111 , H04L49/15
Abstract: 本申请公开了计算机技术领域内的一种设备互联系统、方法、设备、介质及程序产品。本申请将不同硬件资源设备,如内存设备、硬件加速设备或计算设备等,纳入不同资源池;并且,各资源池中的至少一个交换芯片的至少一个上游端口连接其他资源池中的至少一个交换芯片的上游端口,实现了不同资源池之间的互联;各资源池中的至少一个交换芯片的至少一个下游端口连接硬件资源设备,以尽可能少的端口数量实现了系统内设备的互联,下游设备无需两两相连,减少了连接线数量和布线布局复杂度,通信延迟能够相应降低,满足了低延迟要求业务的通信需求。
-
公开(公告)号:CN118550710B
公开(公告)日:2024-10-11
申请号:CN202411010565.8
申请日:2024-07-26
Applicant: 浪潮(北京)电子信息产业有限公司
IPC: G06F9/50 , G06F9/48 , H04L45/028 , H04L67/1025
Abstract: 本发明公开了一种算力路由方法、设备、系统、产品及可读存储介质,涉及算力调度领域,为解决静态规则路由无法适应动态的环境变化的问题,该算力路由方法包括获取第一算力资源信息和待处理计算任务的任务特性信息;根据所述任务特性信息和所述第一算力资源信息获取将所述待处理计算任务转发到各个邻域节点的概率分布;在所述概率分布中进行采样得到目标转发节点,将所述任务特性信息转发到所述目标转发节点。本发明能够适应算力调度系统中的动态环境变化,提高算力调度系统的资源利用率和安全性,优化算力调度系统的性能。
-
公开(公告)号:CN118709745A
公开(公告)日:2024-09-27
申请号:CN202411162431.8
申请日:2024-08-23
Applicant: 浪潮(北京)电子信息产业有限公司
Abstract: 本申请公开了一种计算系统、模型训练方法、装置及设备、介质和产品,涉及计算机技术领域,该人工智能计算系统包括多个计算节点,多计算节点包括主机、计算设备和网卡;计算设备包括第一硬件接口、第一设备一致性维护引擎、第一计算核心,计算设备通过第一硬件接口连接主机;网卡包括第二硬件接口、第二设备一致性维护引擎,网卡通过第二硬件接口连接主机;计算设备通过缓存的刷新操作与网卡的网卡内存之间传输梯度数据,网卡用于与其他计算节点同步梯度数据。本申请提高了计算设备与网卡梯度数据的传输效率,进而提高了人工智能模型的训练效率。
-
公开(公告)号:CN118536073A
公开(公告)日:2024-08-23
申请号:CN202410986270.8
申请日:2024-07-23
Applicant: 浪潮(北京)电子信息产业有限公司
IPC: G06F18/25 , G06F7/50 , G06N20/00 , G06F17/16 , G06F18/213
Abstract: 本申请公开了计算机技术领域内的一种加速器、数据处理方法、设备、介质、程序产品及系统。本申请在加速器中实现特征矩阵的特征融合操作,加速器可完成特征矩阵的自动分割,并实现有乘加、累加等运算逻辑,支持任意尺寸的矩阵的输入;其中的第一存储器和第二存储器以乒乓方式进行子矩阵缓存,可实现多个子矩阵的并行数据读取与计算,且脉动阵列能够达到更快的运算效率,为提高特征融合操作的处理效率提供了可能。
-
公开(公告)号:CN118227343B
公开(公告)日:2024-07-26
申请号:CN202410658894.7
申请日:2024-05-27
Applicant: 浪潮(北京)电子信息产业有限公司
IPC: G06F9/50 , H04L67/1008 , H04L67/101 , H04L67/1097
Abstract: 本发明公开了一种数据处理方法、系统、装置、设备、介质及产品,涉及通信技术领域。负载的计算资源(硬件加速器)由开放性互联协议单独传输至DPU,无需仅通过CPU和网卡这样的传输途径,这样计算资源和存储资源各自占用一条传输途径,使得CPU的带宽利用率提高,同时为其他存储资源的负载提供更多的带宽利用,也节省CPU的计算资源。另外,基于开放式互联协议进行数据传输,在DPU内获取信息的带宽和时延显著提升。同时,硬件加速器和CPU各自的传输途径,使得不支持开放式互联协议的部件依旧可以采用原有的CPU进行通信传输,进而保证足够的设备兼容性。
-
公开(公告)号:CN118353776A
公开(公告)日:2024-07-16
申请号:CN202410750211.0
申请日:2024-06-12
Applicant: 浪潮(北京)电子信息产业有限公司
IPC: H04L41/08 , H04L41/0896 , H04L41/12
Abstract: 本发明公开了计算机通信技术领域内的一种通信方法、装置、设备、介质、计算机程序产品及系统。本发明所提供系统中的各个加速设备可以直接互相连接并自主通信,无需借助加速设备所属节点实现不同加速设备之间的通信;并且,不同加速设备之间的连接方式与根据节点间通信频次得到,也就是:不同加速设备之间的连接方式与系统中各节点所运行的任务的繁忙程度相匹配,由此得到的设备拓扑图适用于系统中各节点所运行的任务,能够提高加速设备之间的通信速率和带宽。
-
公开(公告)号:CN117827449A
公开(公告)日:2024-04-05
申请号:CN202311865605.2
申请日:2023-12-29
Applicant: 浪潮(北京)电子信息产业有限公司
Abstract: 本申请公开了一种服务器的物理内存扩展架构、服务器、方法、设备及介质,涉及内存管理领域,用于解决单个服务器物理地址空间受限进而无法高效运行超大型应用程序的问题。该方案包括与所述中央处理器的扩展端口连接的第一扩展设备以及至少一级的第i扩展设备,各扩展设备均包括物理内存且设有物理地址。本申请通过连接多个扩展设备来扩展服务器的物理内存空间,这样一来,即使单个服务器的物理地址空间受限,但通过连接多个扩展设备,可以实现更大范围的物理内存空间,应用程序可以在更大范围的物理内存空间中运行,而无需更改应用程序架构或分布式部署在多台服务器上,从而解决了单个服务器无法高效运行超大型应用程序的问题。
-
-
-
-
-
-
-
-
-