-
公开(公告)号:CN105354117B
公开(公告)日:2018-10-19
申请号:CN201510702707.1
申请日:2015-10-26
Applicant: 清华大学
IPC: G06F11/22
Abstract: 超标量处理器中指令相关性检测的方法,通过设定一组锁定标识,指令解码后,将其源操作数与目的操作数分别与对应的锁定标识相比较,来判断指令的相关性与并行性;锁定标识根据每个周期指令的解码信息进行更新,每个周期更新一次;锁定标识与处理器内的通用寄存器组一一对应,每个通用寄存器都有一个对应的锁定标识;本发明不仅适用于检测同一周期内多条指令能否同时发射,也适用于检测不同流水级的各组指令之间的相关性;为实现指令的动态调度提供了基础的保证,而且该方法的实现并不会涉及很复杂的电路设计,能够很大程度上减小硬件开销。
-
公开(公告)号:CN105867884B
公开(公告)日:2018-06-15
申请号:CN201610177103.4
申请日:2016-03-24
Applicant: 清华大学
IPC: G06F9/38
Abstract: 一种改进型PAp分支预测方法,包括降低预测器训练时间方法和提高分支预测准确率方法,降低预测器训练时间方法包括:使用一种新的有限状态机来表示跳转指令的跳转方向;改进第一次训练时跳转方向训练方法;以及改进PT表计数器计数规则;提高分支预测准确率方法包括:在取指级当遇到不跳转的跳转指令时,同一个取指包中多取一套预测信息;跳转出错后对PT表计数器正确复位,本发明可降低预测训练时间,提高预测效率并提高预测准确率,从而提高处理器性能。
-
公开(公告)号:CN105139071A
公开(公告)日:2015-12-09
申请号:CN201510447062.1
申请日:2015-07-27
Applicant: 清华大学
Abstract: 一种以现场可编程门阵列的逻辑片为基本单元模拟生物神经元网络的方法,将现场可编程器件中的逻辑片(slice)与神经元细胞结构的相应部分形成映射,即确定各个控制信号添加方式;采用图形处理器(GPU)仿真FPGA行为进行在线学习,或者直接利用FPGA硬件网络进行在线学习;将学习的所得到的控制信息写成比特文件,通过比特文件直接配置FPGA,提高对FPGA的使用效率,本发明利用单个逻辑片来实现了对一个神经元细胞的映射,将单片可编程器件上可模拟神经元细胞的数量提高了数十倍;其次通过比特文件来配置可编程器件,从底层硬件开始设计,从而增加了可编程器件的可控性。
-
公开(公告)号:CN101751244B
公开(公告)日:2013-05-08
申请号:CN201010033646.1
申请日:2010-01-04
Applicant: 清华大学
Abstract: 本发明公开了一种微处理器,该微处理器包括:指令获取模块,其用于获取将要执行的指令;指令分发模块,其用于将从指令获取模块得到的指令进行分发;指令执行模块,其用于对从指令分发模块得到的指令进行解码并执行指令;寄存器堆,其用于存储指令执行结果;管理系统,管理指令执行过程中的程序和数据,指令执行模块包括完成算术逻辑运算和移位计算的A单元、完成乘法运算的M单元、实现管理系统存取和程序跳转的D单元以及完成浮点运算的F单元。该微处理器采用超长指令结构,并利用增加的F单元来进行浮点运算,使其同时具备了单周期多指令和单指令多数据的特点,提高了微处理器的操作性能。
-
公开(公告)号:CN101866281A
公开(公告)日:2010-10-20
申请号:CN201010207978.7
申请日:2010-06-13
Applicant: 清华大学
IPC: G06F9/38
Abstract: 本发明提出了一种多周期指令执行方法,包括以下步骤:对指令码进行初始化且保存完成初始化的指令信息;根据所有完成初始化的有效指令信息判决下一条进入流水线的指令为正常流水线指令或者空泡指令且产生指示信号;根据所述指令信息判断是否对执行结果进行缓存、直接寄存或者缓存写入寄存器,且为后续进入流水线的指令提供所述执行结果;根据所述指示信号和所述执行结果对所述指令信息进行判断以更新所述指令信息。通过本发明的多周期指令执行方法,保证了在指令执行周期发生变化后执行指令的正确性。
-
公开(公告)号:CN101615111A
公开(公告)日:2009-12-30
申请号:CN200910090203.3
申请日:2009-07-31
Applicant: 清华大学
Abstract: 本发明提出一种一条指令完成一次反量化的微处理器实现方法,包括以下步骤:解码级解析指令,并产生操作码;根据所述解析指令从源寄存器中获取操作数;根据所述操作数的符号对所述操作数进行反量化操作,并将结果存入目标寄存器。通过本发明能够实现一条指令完成一次反量化的功能,从而能够有效地提高处理器的性能。
-
公开(公告)号:CN101526893A
公开(公告)日:2009-09-09
申请号:CN200810101451.9
申请日:2008-03-06
IPC: G06F9/38
Abstract: 一种电子技术领域中超长指令字指令并行执行方法,获取超长指令字包;根据获取的超长指令字包中各指令对应的功能单元的编号大小判断当前指令是否能够与下一指令并行执行;根据上述判断结果执行各指令。本发明实施例还提供一种超长指令字指令并行执行装置。本发明实施例根据功能单元的编号大小来判断当前指令与下一指令是否可以并行执行,解决了指令中需要额外信息来指示多指令在多功能单元并行执行带来的编码效率低的问题。减少了并行指示位,扩大了编码空间,降低了并行执行信息在整个指令中占用的存储空间。
-
公开(公告)号:CN101470600A
公开(公告)日:2009-07-01
申请号:CN200810006836.7
申请日:2008-02-02
IPC: G06F9/38
Abstract: 本发明公开了一种超长指令处理的方法,包括:根据指令编码中的功能单元类型标识任意选择一个同类型的功能单元,并向所述功能单元分发所述指令编码;将所述指令编码进行译码,获知所述功能单元所要执行的操作指令和所述功能单元所要访问的寄存器堆;根据所述操作指令从所述寄存器堆读取数据进行操作。本发明实施例不对功能单元分组,避免经过交叉访问结构访问寄存器堆,提高了数据交换的能力,增加了功能单元的数据访问灵活性。
-
-
-
-
-
-
-