-
公开(公告)号:CN117992235A
公开(公告)日:2024-05-07
申请号:CN202410236006.2
申请日:2024-03-01
申请人: 上海壁仞科技股份有限公司
摘要: 本公开提供一种运算装置及其操作方法和机器可读存储介质。该运算装置包括至少一个计算核、第一合并缓存、第一逻辑运算器、第二缓存及第二逻辑运算器。第一逻辑运算器被配置为:计数具备相同寄存器位置的线程请求各自的数量,并将该数量中第二多者作为第一数量;基于第一数量将线程请求区分为第一线程请求及第二线程请求,其中,在相同寄存器位置上第一线程请求的数量小于或等于第一数量;提供第一线程请求第二缓存及第二逻辑运算器,以使第二逻辑运算器进行运算;以及,依据第二线程请求进行运算,其中,第一逻辑运算器与第二逻辑运算器并行地进行运算。本公开的运算装置及其操作方法可进一步地利用运算资源,减少性能损失。
-
公开(公告)号:CN117971543A
公开(公告)日:2024-05-03
申请号:CN202410186127.0
申请日:2024-02-19
申请人: 上海壁仞科技股份有限公司
发明人: 请求不公布姓名
摘要: 本发明提供一种系统级芯片问题定位方法、装置、电子设备及存储介质,属于芯片测试技术领域,方法适用于仿真服务器,包括基于监控模块获取系统级芯片所有接口的操作数据和响应数据,所述监控模块与所述接口一一对应;根据所述操作数据、所述响应数据以及预先收到的所述接口的地址数据,确定问题接口以实现问题定位。本发明在仿真服务器上为系统级芯片的每个接口设置监控模块,获取接口的操作数据和响应数据,并基于预先收到的所述接口的地址数据进行问题定位,无需为每个IP、每个接口添加中断功能,降低设计工作量,还能实现SOC芯片的全面验证,无需验证工程师一一排查,提高了验证效率。
-
公开(公告)号:CN117971501A
公开(公告)日:2024-05-03
申请号:CN202410369923.8
申请日:2024-03-28
申请人: 北京壁仞科技开发有限公司 , 上海壁仞科技股份有限公司
摘要: 本申请实施例提供了一种数据访问方法、设备、存储介质及程序产品,涉及集成电路技术领域,该方法包括:对内存中存储的待处理图像的原始感兴趣区域进行扩展获得目标感兴趣区域,使得目标感兴趣区域在内存上是连续的。采用连续访存方式从内存中读取目标感兴趣区域,并通过多个执行单元对读取的目标感兴趣区域包含的原始感兴趣区域进行计算。相较于采用非连续访存方式从内存中读取数据来说,连续访存方式提高了访存效率,也提高了对原始感兴趣区域进行计算的效率,进而提升图像处理算子的性能。由于目标感兴趣区域在内存上是连续的,故可以为多个执行单元均匀分配读取任务,避免多个执行单元上的任务不均衡的问题,提高硬件资源利用率。
-
公开(公告)号:CN117971349A
公开(公告)日:2024-05-03
申请号:CN202410382891.5
申请日:2024-03-29
申请人: 北京壁仞科技开发有限公司 , 上海壁仞科技股份有限公司
摘要: 本公开提供了一种计算设备、一种为计算设备配置虚拟寄存器的方法、一种控制设备、一种计算机可读存储介质和一种计算机程序产品。该计算设备包括:多个计算单元,每个计算单元被配置为运行线程束的一个线程;专用于每个计算单元的多个线程本地寄存器,用于寄存与所述计算单元运行的线程相关联的数据;以及用于所述多个计算单元的共享缓存器,其中,所述共享缓存器的一部分被配置为用于所述多个计算单元的虚拟寄存器,并且每个计算单元的多个线程本地寄存器中的至少一个线程本地寄存器被配置为中转寄存器以用于所述计算单元运行的线程访问所述虚拟寄存器。
-
公开(公告)号:CN117785591B
公开(公告)日:2024-04-26
申请号:CN202410216791.5
申请日:2024-02-27
申请人: 北京壁仞科技开发有限公司 , 上海壁仞科技股份有限公司
IPC分类号: G06F11/22
摘要: 本公开提供了一种用于计算设备的计算内核的调试方法、计算设备、计算机可读存储介质和计算机程序产品。该调试方法包括:配置调试张量以用于一个应用的多个线程束在所述计算设备的所述计算内核上的调试,所述调试张量的参数包括所述多个线程束的数量、用于每个线程束的调试内存大小以及所述多个线程束的偏移向量;在所述计算内核上对所述应用进行编译后,将所述计算设备的一个或多个计算单元的调试日志打印到所述调试张量所指示的调试内存;以及输出所述调试日志以确定调试日志异常的计算单元以及所述调试日志异常的计算单元所运行的线程束。
-
公开(公告)号:CN117910549A
公开(公告)日:2024-04-19
申请号:CN202410176300.9
申请日:2024-02-07
申请人: 上海壁仞科技股份有限公司
摘要: 一种分布式训练方法、装置和存储介质。该分布式训练方法包括:获取N个输入数据中的第n‑1个输入数据和第n个输入数据;通过第n‑1个处理器获取第n‑1个输入数据和第n个输入数据对应的第一损失函数;通过第n个处理器获取第n‑1个输入数据和第n个输入数据对应的第二损失函数;基于N个输入数据的第一损失函数和第二损失函数获取梯度标量;基于梯度标量更新神经网络的权重参数;N为大于0的偶数,n为大于1小于等于N的整数。该分布式训练方法大大的提高了数据处理的效率。
-
公开(公告)号:CN117909257A
公开(公告)日:2024-04-19
申请号:CN202410084652.1
申请日:2024-01-19
申请人: 上海壁仞科技股份有限公司
IPC分类号: G06F12/0877 , G06F12/1018
摘要: 本发明提供一种缓存行的存储方法、装置、电子设备及存储介质,涉及芯片技术领域;方法包括:对虚拟地址空间中每一个数据子块包括的M个初始缓存行进行散列映射,得到相应的M个中间缓存行;针对任一个数据子块,基于散列映射后的M个中间缓存行及预设命中概率,确定数据子块包括的M个初始缓存行中的目标缓存行;将各数据子块中的目标缓存行存储至二级缓存中。上述方法中,考虑了不同数据子块之间的数据差异性,在对每个数据子块包括的M个初始缓存行进行散列映射之后,使每个数据子块的映射效果具有一定的关于数据地址的随机性,提高了各数据子块中各目标缓存行的使用概率,进而提高了二级缓存的使用率。
-
公开(公告)号:CN117908965A
公开(公告)日:2024-04-19
申请号:CN202410176031.6
申请日:2024-02-07
申请人: 上海壁仞科技股份有限公司
摘要: 本发明提供一种内核执行方法、装置、电子设备和存储介质,其中方法包括:执行第一内核的预加载,所述预加载用于加载内核执行所需的数据;在所述第一内核的预加载完成后,执行所述第一内核,并在所述第一内核的执行过程中,执行第二内核的预加载;在所述第一内核执行完成、且所述第二内核的预加载完成后,执行所述第二内核。本发明提供的方法、装置、电子设备和存储介质,将第二内核的预加载提前到第一内核的执行过程中实现,压缩了第一内核和第二内核在执行上的时间间隔,提高了整体执行效率。并且,提前执行预加载,无需用户修改内核代码,可由硬件控制直接实现,具备通用性,大大降低了通过提前执行预加载来提升执行效率的实现成本。
-
公开(公告)号:CN117892779A
公开(公告)日:2024-04-16
申请号:CN202410071156.2
申请日:2024-01-17
申请人: 上海壁仞科技股份有限公司
IPC分类号: G06N3/0495 , G06N3/0475 , G06N5/04 , G06F15/78
摘要: 本发明提供一种模型缓存量化方法及装置,所述方法包括:对模型的缓存进行切块,得到多个缓存块;采用原始精度在当前缓存块存储对应推理数据,直至当前缓存块的存储空间达到容量上限时,对当前缓存块所存储的推理数据进行量化处理。本发明提供的模型缓存量化方法及装置,采用原始精度在当前缓存块存储对应推理数据,即当前缓存块中参与推理运算的是原始高精度数据,从而能够保证模型精度。此外,在当前缓存块的存储空间达到容量上限时,对当前缓存块所存储的推理数据进行量化处理,从而能够在保证模型精度的基础上节省内存开销。
-
公开(公告)号:CN117892681A
公开(公告)日:2024-04-16
申请号:CN202410294809.3
申请日:2024-03-15
申请人: 北京壁仞科技开发有限公司 , 上海壁仞科技股份有限公司
IPC分类号: G06F30/392 , G06F30/394 , G06F30/398
摘要: 本公开涉及一种修复电压降的方法、电子设备、存储介质和程序产品,该方法包括:根据电压降违例单元信息,确定违例单元集合,违例单元集合包括处于模块边界的电压降违例单元;根据违例单元集合,确定修复区域,其中,修复区域涵盖违例单元集合;在修复区域内的预设金属层中添加电源网络,其中,电源网络电连接于违例单元集合中的每一个电压降违例单元。本公开实现了对模块边界区域集中出现的两个或两个以上电压降违例单元的同步修复,整体上有助于缩短模块边界电压降违例的修复时间,在整体上有助于提升修复模块边界电压降违例的效率。
-
-
-
-
-
-
-
-
-