一种多级页表遍历方法、装置、电子设备及存储介质

    公开(公告)号:CN117971711B

    公开(公告)日:2024-06-28

    申请号:CN202410383635.8

    申请日:2024-04-01

    发明人: 苏叶华

    摘要: 本申请涉及一种多级页表遍历方法、装置、电子设备及存储介质,属于计算机领域。该多级页表遍历方法包括:获取页表遍历请求;在页表缓存中查找是否有命中所述页表遍历请求的页表数据,其中,所述页表缓存中缓存有已遍历过的页表数据;如果有命中的页表数据,基于命中的页表数据以及所述页表遍历请求进行下一层级页表的遍历,直至遍历到最后一级页表,其中,所述下一层级页表为所述命中的页表数据对应的页表层级的下一级页表。本申请能够提高页表的遍历效率,提高地址转换的效率。

    支持指令多发的计算单元、方法及相应图形处理器

    公开(公告)号:CN117707625B

    公开(公告)日:2024-05-10

    申请号:CN202410159979.0

    申请日:2024-02-05

    IPC分类号: G06F9/38 G06T1/20

    摘要: 本申请提供了支持指令多发的计算单元、方法及相应图形处理器。计算单元包括指令缓存、调度控制器、至少两个不同类型的运算单元组和与每个运算单元组相关联的暂存器;其中调度控制器被配置为从指令缓存中预先提取待处理的多个指令,并将每个指令存入与可处理该指令的运算单元组相关联的暂存器,各个运算单元组能够分别执行其关联的暂存器中操作数就绪的指令。该解决方案允许一个时钟周期发射不止一个指令到计算单元上运行,从而能更充分地利用每个计算单元上的不同类型的计算资源,并改善指令调度和执行效率,进而提高图形处理器的计算性能。

    支持指令多发的计算单元、方法及相应图形处理器

    公开(公告)号:CN117707625A

    公开(公告)日:2024-03-15

    申请号:CN202410159979.0

    申请日:2024-02-05

    IPC分类号: G06F9/38 G06T1/20

    摘要: 本申请提供了支持指令多发的计算单元、方法及相应图形处理器。计算单元包括指令缓存、调度控制器、至少两个不同类型的运算单元组和与每个运算单元组相关联的暂存器;其中调度控制器被配置为从指令缓存中预先提取待处理的多个指令,并将每个指令存入与可处理该指令的运算单元组相关联的暂存器,各个运算单元组能够分别执行其关联的暂存器中操作数就绪的指令。该解决方案允许一个时钟周期发射不止一个指令到计算单元上运行,从而能更充分地利用每个计算单元上的不同类型的计算资源,并改善指令调度和执行效率,进而提高图形处理器的计算性能。

    一种数据冒险解决方法、计算引擎、处理器及电子设备

    公开(公告)号:CN117667223A

    公开(公告)日:2024-03-08

    申请号:CN202410139500.7

    申请日:2024-02-01

    发明人: 王刚 廖群峰 张毅

    IPC分类号: G06F9/38

    摘要: 本申请涉及一种数据冒险解决方法、计算引擎、处理器及电子设备,属于计算机领域。该方法包括:从指令缓存中读取指令;根据等待指令记分牌的状态,判断是否对读取的指令进行调度;在对读取的指令进行调度后,若读取的指令为等待指令,根据等待指令携带的指令ID,查询事件记录项中对应的事件状态,根据事件状态对等待指令进行冒险检测;在等待指令存在冒险时,更新等待指令记分牌的状态;若读取的指令为非等待指令,为非等待指令分配事件ID,并在事件记录项中添加当前分配的事件ID的事件状态,并更新事件状态为使用状态。采用本申请所示的方案,可以提高数据冒险解决方案的灵活性,减少不必要的阻塞,提升系统性能。

    矩阵乘运算方法、装置和电子设备

    公开(公告)号:CN117093816B

    公开(公告)日:2024-01-19

    申请号:CN202311352804.3

    申请日:2023-10-19

    发明人: 姜沛

    IPC分类号: G06F17/16 G06F7/523

    摘要: 本申请提供了一种矩阵乘运算方法、装置和电子设备,其中,该方法包括:面临数据量大的通用矩阵乘运算,将待进行矩阵乘运算的第一输入数据和第二输入数据进行拆分、组合,并将组合得到的数据单元组分配给具有多个加速运算单元的加速运算器,以使各加速运算单元进行并行计算,将各加速运算单元的运算结果进行组合,得到第一输入数据和第二输入数据的运算结果。从而加速了运算过程,提高了运算速度。

    片内异构人工智能处理器

    公开(公告)号:CN112465129B

    公开(公告)日:2024-01-09

    申请号:CN201910846915.7

    申请日:2019-09-09

    IPC分类号: G06N3/063 G06F9/38

    摘要: 本发明的实施例提供了片内异构人工智能处理器,包括至少两种不同结构类型的计算单元;与每个计算单元对应的任务队列,分别用于保存该计算单元待执行的计算子任务;控制器,用于将收到的待处理的神经网络的计算图按照预设的调度策略分解成多个计算子任务并分发至各个计算单元的相应任务队列中;以及用于存放各计算单元执行计算子任务时所需数据的存储单元和用于访问片外内存的访存接口。本发明实施例的技术方案中采用片内异构的形式管理和调度不同结构类型计算单元来处理不同的应用任务,使得人工智能处理器能灵活适应不同应用场景,不仅提高了可扩展性,也改善了处理不同任务的效率。

    一种SIMT装置、线程组动态构建方法及处理器

    公开(公告)号:CN117009054A

    公开(公告)日:2023-11-07

    申请号:CN202310934100.0

    申请日:2023-07-27

    发明人: 马亮

    IPC分类号: G06F9/48 G06F9/52

    摘要: 本发明提供一种SIMT装置、线程组动态构建方法及处理器,所述SIMT装置包括线程组管理模块和指令执行模块,其中,所述线程组管理模块用于存储线程组的信息以及调度线程组,所述线程组管理模块被配置为:根据来自同一个协作工作组的多个目标线程组,从所述多个目标线程组包括的多个线程中确定出多个可发射线程,所述多个目标线程组中的任一个目标线程组是有依赖线程组或分支线程组;将多个可发射线程重组为重组线程组;所述指令执行模块包括多个指令执行单元,所述指令执行模块用于根据重组线程组中的线程执行对应的指令。本发明通过动态构建线程组,可以极大的提升线程执行效率,提高指令执行单元的运行效率。

    芯片控制方法、芯片组及电子设备

    公开(公告)号:CN115994115B

    公开(公告)日:2023-10-20

    申请号:CN202310280494.2

    申请日:2023-03-22

    发明人: 马亮

    IPC分类号: G06F15/78 G06F12/06 G06F13/42

    摘要: 本申请提供一种芯片控制方法、芯片组及电子设备,方法包括:通过第一芯片的主机接口从主机获取命令列表并发送给目标控制引擎;所述目标控制引擎为芯片组中至少一个芯片的控制引擎;所述芯片组包括所述第一芯片以及与所述第一芯片通信连接的至少一个第二芯片;通过所述目标控制引擎将所述命令列表中的目标命令分发至目标数据运算单元进行处理;其中,所述目标命令为需要所述目标控制引擎处理的命令,所述目标数据运算单元为所述目标控制引擎管理的数据运算单元。本申请对主机上的软件和应用层而言,编程的输入接口只有一个,从而简化了软件编程复杂度,缓解了多个芯片封装在一起时所带来的可编程性问题,并实现了芯片间的协同工作。

    阵列输入策略的确定方法和系统

    公开(公告)号:CN116136752A

    公开(公告)日:2023-05-19

    申请号:CN202310416891.8

    申请日:2023-04-19

    发明人: 李国嵩

    IPC分类号: G06F7/46 G06N20/00

    摘要: 本申请提供了一种阵列输入策略的确定方法和系统,其中,该方法包括:根据指示标记,计算乘法累加阵列的当前功耗值和当前功耗变化率,若当前功耗值不满足预设功耗条件,和/或以功耗变化率不满足预设功耗变化率条件,则调整多个阵列模块中至少一个阵列模块的指示标记,根据调整后的至少一个阵列模块的指示标记,确定乘法累加阵列的输入策略,输入策略用于指示阻塞至少一个阵列模块进行数据运算,或者,输入预设数据至至少一个阵列模块进行数据运算。在本申请中,通过阻塞或输入预设数据至乘法累加阵列来减小电流变化率,平滑电流变化曲线,使大规模乘法累加阵列满足电器物理设计要求。