-
-
公开(公告)号:CN118963994A
公开(公告)日:2024-11-15
申请号:CN202410947523.0
申请日:2024-07-15
申请人: 上海壁仞科技股份有限公司
IPC分类号: G06F9/50
摘要: 本公开的实施例提供了一种资源管理方法、电子设备和存储介质。该方法包括:根据多个中间表示中每个中间表示的属性,将多个中间表示划分为至少一个基本块;基于多个中间表示中每个中间表示的类型以及至少一个基本块的边界信息确定资源状态信息,资源状态信息记录了多个中间表示的资源需求;以及基于资源状态信息对多个中间表示进行资源分配和释放。该方法利用类似面向过程的计算机编程语言的语法对中间表示的表达式进行处理,减少了人工操作,有利于自动化和泛化实现。并且,该方法无需显式指明资源列表,支持自动判断资源生命周期,可以在不同处理阶段直接对任意中间表示的瞬时资源进行分配和其他操作,有利于实现高效的资源管理。
-
公开(公告)号:CN118963967A
公开(公告)日:2024-11-15
申请号:CN202411225259.6
申请日:2024-09-02
申请人: 上海壁仞科技股份有限公司
摘要: 本发明提供一种任务调度方法、装置、电子设备及存储介质,其中方法包括:响应于任务调度指令,获取人工智能算子的目标计算任务预处理后的不同数据块调度配置参数;各数据块调度配置参数由主控处理器提供;基于各数据块调度配置参数,确定与当前可用计算单元的数量匹配的多个目标数据块坐标,并执行处理多个目标数据块坐标各自对应目标数据块的子计算任务。本发明结合可用计算单元的数量等参数进行调度具有更好的负载均衡效果,同时也能尽可能避免处理器处于闲置状态,确保每个处理器具有更好的计算效率,提高了人工智能算子性能,同时结合前端的主控处理器和后端的人工智能芯片之间交互的异构框架场景也扩大了算子任务调度的适用场景。
-
公开(公告)号:CN118963738A
公开(公告)日:2024-11-15
申请号:CN202411433151.6
申请日:2024-10-15
申请人: 北京壁仞科技开发有限公司 , 上海壁仞科技股份有限公司
摘要: 本公开的实施例提供了一种基于代码生成器Codegen的算子框架、构建方法及算子生成方法。该算子框架包括:预设代码单元,被配置为获取线程束组索引以及进行全局配置;至少一个第一代码单元,被配置为承载功能代码,其中,不同的第一代码单元对应于不同的线程束组;以及第一选择单元,被配置为根据线程束组索引选择执行的第一代码单元。通过本公开实施例提供的算子框架及其构建方法,可以预先生成一系列经过设计和验证的算子框架,开发者在开发算子时,可以利用这些预设的算子框架,并在其基础上进行开发,不仅可以简化汇编语言算子的开发流程,提高开发效率,减少出错的概率,还能增强算子生成程序的通用性和可维护性。
-
公开(公告)号:CN118567610B
公开(公告)日:2024-11-08
申请号:CN202411052381.8
申请日:2024-08-01
申请人: 北京壁仞科技开发有限公司 , 上海壁仞科技股份有限公司
IPC分类号: G06F7/76
摘要: 本发明的实施例涉及一种用于生成输入掩码张量的方法、计算设备、存储介质和计算机程序产品。该方法在设备端处执行,并且包括:至少基于输入张量,确定输入掩码张量的张量维度和用于填充输入掩码张量的数据;以及由设备端中的至少一个计算单元,基于输入掩码张量的张量维度和用于填充输入掩码张量的数据,生成输入掩码张量,其中,所生成的输入掩码张量中的数据为比特型数据。本发明的实施例能够在设备端处直接生成用于masked_fill函数的输入掩码张量,省略了主机端与设备端之间关于输入掩码张量的传输过程,节省时间。
-
公开(公告)号:CN118863065A
公开(公告)日:2024-10-29
申请号:CN202411083004.0
申请日:2024-08-07
申请人: 上海壁仞科技股份有限公司
摘要: 本发明提供一种模型首字推理方法及装置,所述方法包括:获取模型的计算图,并从计算图中确定模型的末个注意力模块所在的计算子图;在计算子图中添加剪切节点,基于添加剪切节点后的计算子图,应用输入文本,进行模型首字推理,得到首字推理结果;剪切节点位于上一计算子图的输出节点之后,剪切节点用于在每个批次的行维度上对上一节点的输出进行剪切操作。本发明将剪切节点设置于上一计算子图的输出节点之后,从而剪切节点能够在每个批次的行维度上对上一节点的输出进行剪切操作,不仅能够去除冗余计算,提高首字推理效率,且去除冗余计算后也不会影响首字推理结果的计算精度。
-
公开(公告)号:CN118860984A
公开(公告)日:2024-10-29
申请号:CN202411097497.3
申请日:2024-08-09
申请人: 上海壁仞科技股份有限公司
发明人: 请求不公布姓名
IPC分类号: G06F16/16 , G06F16/172 , G06Q10/10
摘要: 本发明提供一种芯片标识符管理方法、装置、设备、介质和产品,涉及计算机软件技术领域,方法包括获取待转换的芯片标识符列表文件,芯片标识符列表文件包括至少一预设类型的第一芯片标识符;确定各第一芯片标识符对应的芯片类型,构建与芯片类型对应的目标编码表;根据目标编码表以及预先确定的目标类型的第二芯片标识符的生成规则,构建编解码算法;根据编解码算法对芯片标识符列表文件进行转换,得到包含第二芯片标识符的目标芯片标识符列表文件。本发明通过构建编解码算法,可直接将第一芯片标识符管理为第二芯片标识符,实现自动化转换,提高了转换效率,无需手动粘贴复制和计算器辅助转换,避免粘贴复制中的错误,提高了准确率。
-
公开(公告)号:CN118860658A
公开(公告)日:2024-10-29
申请号:CN202411097268.1
申请日:2024-08-09
申请人: 上海壁仞科技股份有限公司
发明人: 请求不公布姓名
摘要: 本发明涉及计算机技术领域,提供一种性能计数器数据的压缩/解压方法、装置及电子设备,该性能计数器数据的压缩方法包括:获取人工智能芯片中至少两个目标执行单元的性能计数器的数据块;根据获取的数据块的相似性,确定待差分的数据块集合;计算待差分的数据块中除基准数据块外的数据块中数据元素与基准数据块中对应的数据元素的差值;基于基准数据块以及计算出的差值生成压缩数据。该方法基于基准数据块以及计算出的差值生成压缩数据,提高了人工智能芯片性能计数器数据的压缩率,降低了压缩的计算开销。
-
公开(公告)号:CN118626146B
公开(公告)日:2024-10-29
申请号:CN202411081222.0
申请日:2024-08-08
申请人: 北京壁仞科技开发有限公司 , 上海壁仞科技股份有限公司
IPC分类号: G06F9/30
摘要: 本发明提供一种人工智能芯片及其寄存器空间动态管理方法和机器可读存储介质、计算机程序产品。人工智能芯片包括指令高速缓存、寄存器电路以及执行电路。指令高速缓存用以存放线程束运行所需的指令。寄存器电路用以提供寄存器空间。执行电路耦接至指令高速缓存以及寄存器电路。执行电路从指令高速缓存取得且执行所述线程束。线程束包括第一子程序段,其中第一子程序段需要使用第一寄存器空间。执行电路在执行线程束的过程中要求寄存器电路从寄存器电路的寄存器空间中分派第一寄存器空间给第一子程序段使用。在第一子程序段执行完成后且在线程束执行完成前,执行电路要求寄存器电路实时释放第一寄存器空间。
-
公开(公告)号:CN118820170A
公开(公告)日:2024-10-22
申请号:CN202411310847.X
申请日:2024-09-19
申请人: 北京壁仞科技开发有限公司 , 上海壁仞科技股份有限公司
IPC分类号: G06F15/173 , G06F15/78 , G06F13/22 , G06F13/40
摘要: 本发明的实施例涉及一种用于板卡间数据传输的方法、板卡、电子设备和存储介质。该方法包括:向第一板卡发送写指令;响应于接收到写指令,由第一板卡将预定数量的数据写入第二板卡;向第一板卡发送屏障指令,以阻挡第一板卡向第二板卡发送后续指令,直至确定预定数量的数据全部写入第二板卡;由第一板卡确定预定数量的数据是否全部写入第二板卡;以及响应于第一板卡确定预定数量的数据全部写入第二板卡,由第一板卡向第二板卡发送同步信号,以指示预定数量的数据已全部同步至第二板卡。本发明的实施例能够避免第二板卡对第一板卡进行远程轮询,提高数据传输的性能,并且能够确保数据同步的准确性。
-
-
-
-
-
-
-
-
-