-
公开(公告)号:CN115994115B
公开(公告)日:2023-10-20
申请号:CN202310280494.2
申请日:2023-03-22
申请人: 成都登临科技有限公司 , 上海登临科技有限公司
发明人: 马亮
摘要: 本申请提供一种芯片控制方法、芯片组及电子设备,方法包括:通过第一芯片的主机接口从主机获取命令列表并发送给目标控制引擎;所述目标控制引擎为芯片组中至少一个芯片的控制引擎;所述芯片组包括所述第一芯片以及与所述第一芯片通信连接的至少一个第二芯片;通过所述目标控制引擎将所述命令列表中的目标命令分发至目标数据运算单元进行处理;其中,所述目标命令为需要所述目标控制引擎处理的命令,所述目标数据运算单元为所述目标控制引擎管理的数据运算单元。本申请对主机上的软件和应用层而言,编程的输入接口只有一个,从而简化了软件编程复杂度,缓解了多个芯片封装在一起时所带来的可编程性问题,并实现了芯片间的协同工作。
-
公开(公告)号:CN115994115A
公开(公告)日:2023-04-21
申请号:CN202310280494.2
申请日:2023-03-22
申请人: 成都登临科技有限公司 , 上海登临科技有限公司
发明人: 马亮
摘要: 本申请提供一种芯片控制方法、芯片组及电子设备,方法包括:通过第一芯片的主机接口从主机获取命令列表并发送给目标控制引擎;所述目标控制引擎为芯片组中至少一个芯片的控制引擎;所述芯片组包括所述第一芯片以及与所述第一芯片通信连接的至少一个第二芯片;通过所述目标控制引擎将所述命令列表中的目标命令分发至目标数据运算单元进行处理;其中,所述目标命令为需要所述目标控制引擎处理的命令,所述目标数据运算单元为所述目标控制引擎管理的数据运算单元。本申请对主机上的软件和应用层而言,编程的输入接口只有一个,从而简化了软件编程复杂度,缓解了多个芯片封装在一起时所带来的可编程性问题,并实现了芯片间的协同工作。
-
公开(公告)号:CN117009054A
公开(公告)日:2023-11-07
申请号:CN202310934100.0
申请日:2023-07-27
申请人: 北京登临科技有限公司 , 上海登临科技有限公司
发明人: 马亮
摘要: 本发明提供一种SIMT装置、线程组动态构建方法及处理器,所述SIMT装置包括线程组管理模块和指令执行模块,其中,所述线程组管理模块用于存储线程组的信息以及调度线程组,所述线程组管理模块被配置为:根据来自同一个协作工作组的多个目标线程组,从所述多个目标线程组包括的多个线程中确定出多个可发射线程,所述多个目标线程组中的任一个目标线程组是有依赖线程组或分支线程组;将多个可发射线程重组为重组线程组;所述指令执行模块包括多个指令执行单元,所述指令执行模块用于根据重组线程组中的线程执行对应的指令。本发明通过动态构建线程组,可以极大的提升线程执行效率,提高指令执行单元的运行效率。
-
公开(公告)号:CN114721975A
公开(公告)日:2022-07-08
申请号:CN202210350048.X
申请日:2022-04-02
申请人: 上海登临科技有限公司
发明人: 马亮
IPC分类号: G06F12/0877 , G06F9/54
摘要: 本申请提供一种链表处理方法、装置、加速器、电路板、设备和存储介质,该方法包括:接收来自主机的多个链表读请求至预设的命令提交队列中,其中,命令提交队列被配置有预设数量的容纳空间,预设数量的容纳空间用于缓存所述多个链表读请求;根据每个所述链表读请求的接收次序,依次从存储器中读取每个所述链表读请求对应的链表数据,并依次执行多个所述链表数据,链表数据包括:至少一个命令列表;在一个所述链表数据执行完毕后,释放已执行完毕的所述链表数据在所述命令提交队列中对应的容纳空间,以从所述主机接收下一个链表读请求。本申请降低了CPU与计算加速器之间的交互功耗,命令预取模块通过共享命令列表存储器,节约芯片资源。
-
公开(公告)号:CN114548389A
公开(公告)日:2022-05-27
申请号:CN202210100383.4
申请日:2022-01-27
申请人: 上海登临科技有限公司
发明人: 马亮
摘要: 本公开提供了异构计算中计算单元的管理方法及相应处理器,其中为每个计算单元设置有与其对应的命令管理寄存器和命令状态寄存器,命令管理寄存器的各个比特位指示与其对应的计算单元的命令缓存中各个条目是否处于空闲状态,命令状态寄存器的各个比特位指示与其对应的计算单元中各个命令的执行状态。该方案基于命令管理寄存器和命令状态寄存器实现了对多个计算单元的管理,提高了异构计算处理器对计算命令的执行效率,具有良好的可扩展性。
-
公开(公告)号:CN116957908A
公开(公告)日:2023-10-27
申请号:CN202311213405.9
申请日:2023-09-20
申请人: 上海登临科技有限公司
发明人: 马亮
摘要: 本申请涉及一种硬件处理架构、处理器及电子设备,属于电子电路领域。该硬件处理架构包括:块处理模块、第一缓存模块以及像素处理模块。块处理模块被配置为以像素块为单位对输入图像进行第一处理,得到输出数据,其中,第一处理包括代价计算、滤波计算、梯度计算、膨胀计算、腐蚀计算中的至少一种处理;第一缓存模块被配置为存储块处理模块的输出数据;像素处理模块被配置为与存储器连接,以及接收完成指定任务所需的指令流,并根据指令流以线程为单位对第一缓存模块中的第一数据进行第二处理,得到第二处理结果,并将第二处理结果存储到存储器,其中,不同的指令流对应不同的指定任务。本申请能够适用于各种视觉处理任务,提高数据处理效率。
-
公开(公告)号:CN114610472B
公开(公告)日:2022-12-02
申请号:CN202210499566.8
申请日:2022-05-09
申请人: 上海登临科技有限公司
摘要: 本公开提供了异构计算中多进程管理方法及设备,由执行进程的处理器根据其进程控制寄存器中包含的对进程的控制命令,在进程状态寄存器中设置该进程的状态;响应于检测到进程状态寄存器中进程的状态为有效状态,从进程列表中获取该进程的进程信息,将该进程中的各个命令列表发送到相应硬件命令队列中进行执行;以及响应于检测到进程中各命令列表均处理完毕,在进程状态寄存器中将该进程的状态设置为无效状态。该方案以简单高效的方式实现了多进程管理,提高了计算设备的利用率,并降低了软硬件编程的复杂度。
-
公开(公告)号:CN114116015B
公开(公告)日:2022-06-07
申请号:CN202210068762.X
申请日:2022-01-21
申请人: 上海登临科技有限公司
IPC分类号: G06F9/38
摘要: 本发明的实施例提供了用于管理硬件命令队列的方法和系统,在硬件队列内部采用非阻塞的方式执行命令,硬件命令队列可以将当前没有任何依赖关系的命令发射到数据处理模块进行处理,而不需要等待前一条命令的完成;对于待处理的与其他命令有依赖关系的命令,检测其依赖的命令是否执行完毕,如果没有,则可以将该命令暂时缓存,并继续处理后续的命令,从而充分提高了数据并行处理的效率,而且利用简单的机制实现了各硬件命令队列之间的有效同步,既不需要复杂的软件编程,也避免了由于读取外部存储而引起的无效等待。
-
公开(公告)号:CN114579487A
公开(公告)日:2022-06-03
申请号:CN202210229117.1
申请日:2022-03-10
申请人: 上海登临科技有限公司
发明人: 马亮
摘要: 本申请涉及一种计算芯片、电子设备及计算芯片间的数据传输方法,属于数据传输技术领域。该计算芯片包括:数据运算单元和远端数据获取单元。数据运算单元用于产生命令信息包,并将其存储在本地存储器;远端数据获取单元用于将本地存储器中访问同一个目标计算芯片的命令信息包打包形成远端命令包,并将远端命令包发送给目标计算芯片;以及还用于接收目标计算芯片基于远端命令包返回的远端数据包,并将远端数据包中的访存数据存储到本地存储器。本申请中,数据运算单元不直接访问其他计算芯片的存储器,而是采用异步的方式访问其他计算芯片的存储器,从而不需要大的数据存储,进而减少了芯片的面积;避免了小的传输长度,提高了总线效率。
-
公开(公告)号:CN114116015A
公开(公告)日:2022-03-01
申请号:CN202210068762.X
申请日:2022-01-21
申请人: 上海登临科技有限公司
IPC分类号: G06F9/38
摘要: 本发明的实施例提供了用于管理硬件命令队列的方法和系统,在硬件队列内部采用非阻塞的方式执行命令,硬件命令队列可以将当前没有任何依赖关系的命令发射到数据处理模块进行处理,而不需要等待前一条命令的完成;对于待处理的与其他命令有依赖关系的命令,检测其依赖的命令是否执行完毕,如果没有,则可以将该命令暂时缓存,并继续处理后续的命令,从而充分提高了数据并行处理的效率,而且利用简单的机制实现了各硬件命令队列之间的有效同步,既不需要复杂的软件编程,也避免了由于读取外部存储而引起的无效等待。
-
-
-
-
-
-
-
-
-