寄存器对扩展64位操作的方法、图形处理器及电子设备

    公开(公告)号:CN118096490A

    公开(公告)日:2024-05-28

    申请号:CN202410014141.2

    申请日:2024-01-03

    Applicant: 清华大学

    Inventor: 何虎 于芳菲

    Abstract: 本发明提供一种寄存器对扩展64位操作的方法、图形处理器及电子设备,涉及处理器技术领域。若是寄存器对拼接指令则将寄存器对拼接有效位置1,并确定当前指令是否包含寄存器拓展语义。若包含则将扩展部分写入暂存器中并将寄存器扩展有效位置1。若是寄存器拓展指令则将扩展部分写入暂存器中并将寄存器扩展有效位置1;若不是则选择并查看暂存器中的寄存器扩展有效位,若不为1将当前指令直接送入指令缓冲器进行译码;若为1将指令拼接后送入指令缓冲器;若寄存器拼接有效位为1,则将源寄存器与相邻寄存器中的内容读出并拼接为64位作为源操作数,否则不进行拼接操作。本发明按需拼接32位寄存器从而支持64位计算的指令,将计算位宽扩展为64位。

    一种脉冲神经网络的多层训练算法

    公开(公告)号:CN109871940B

    公开(公告)日:2021-07-27

    申请号:CN201910100113.1

    申请日:2019-01-31

    Applicant: 清华大学

    Inventor: 何虎 尚瑛杰

    Abstract: 一种脉冲神经网络的多层训练算法,利用逐层训练的方式,允许层内连接,并将权值训练和结构训练相结合,锐化数据之间的关联性,具体包括:1)数据预处理:将输入数据通过转换函数转化为脉冲序列;2)网络层初始化:设置脉冲神经网络层数、每层神经元数量和层内神经元分布状态;3)层间结构预训练:在初始网络中,网络层间不设置连接,层间连接采用逐层递推的方式生成;4)层间权值归一化:通过对层间权值的归一化操作消除数据差异带来的影响;5)进行层内结构训练:利用神经网络的结构训练算法,进行网络层内的结构训练;6)进行网络权值因果性训练。本发明算法训练的网络具备自组织、自生长能力,算法规则简单,计算量小,对模型精度要求低,易于仿真。

    存算一体处理器、处理系统以及算法模型的部署方法

    公开(公告)号:CN112836814A

    公开(公告)日:2021-05-25

    申请号:CN202110231930.8

    申请日:2021-03-02

    Applicant: 清华大学

    Abstract: 一种存算一体处理器、存算一体处理系统、存算一体处理装置以及基于存算一体处理器的算法模型的部署方法。该存算一体处理器包括第一主控单元和多个忆阻器处理模组,其中,该第一主控单元被配置为能够调度和控制多个忆阻器处理模组,该多个忆阻器处理模组被配置为能够根据该第一主控单元的调度和控制进行计算,该多个忆阻器处理模组还被配置为能够不依赖于该第一主控单元来进行通信以进行计算。该存算一体处理器中的忆阻器处理模组能够根据该第一主控单元的调度和控制进行计算,还能够不依赖于该第一主控单元来进行通信以进行计算,因此,该存算一体处理器具有集成控制流和数据流的混合调度结构,从而在满足灵活性和通用性的同时,具备计算高效性。

    一种规模可扩展的卷积神经网络加速系统与方法

    公开(公告)号:CN111242289A

    公开(公告)日:2020-06-05

    申请号:CN202010059180.6

    申请日:2020-01-19

    Applicant: 清华大学

    Inventor: 何虎 赵烁

    Abstract: 一种规模可扩展的卷积神经网络加速系统,包括处理器和至少一个卷积加速核,单个卷积加速核主要包括计算阵列、控制器和片上缓存,在扩展规模时,只需增加卷积加速核的数量,修改处理器上运行的程序,其它硬件模块无需更改。即,可以增加多个卷积加速核来提高该系统的规模和计算性能,本发明还提供了基于所述规模可扩展的卷积神经网络加速系统的方法,可以极大程度减少因扩展规模而带来的额外开销,从而部署在不同硬件平台。同时软硬件协作的方式通用性较好,可以支持不同的卷积神经网络。相对其他电路,该方法具有通用性和可扩展性。

    一种自生成神经网络构建方法

    公开(公告)号:CN105701540B

    公开(公告)日:2017-12-19

    申请号:CN201610015589.1

    申请日:2016-01-11

    Applicant: 清华大学

    Abstract: 一种自生成神经网络构建方法,包括如下步骤:步骤1,加入刺激信号;步骤2,评估神经元输出强度,确定该神经元的连接方向,不断形成网络连接,最终生成初始网络;步骤3,计算连向目标神经元的位置与概率;步骤4,判断当前网络生成过程是否停止,如果是,则转入步骤5,否则转入步骤2继续;步骤5,通过寻优算法,优化网络连接;步骤6,判断是否还需要加入刺激,如果否,则结束,否则转入步骤1;本发明提出的网络为自生成的网络,可有效减小人为主观因素影响,此外本网络的生成过程与生物神经理论为基础,为进一步探索神经脑,从而实现真正的智能带来可能。

    一种基于进化算法的自适应学习神经网络实现方法

    公开(公告)号:CN105279555B

    公开(公告)日:2017-10-17

    申请号:CN201510714025.2

    申请日:2015-10-28

    Applicant: 清华大学

    Abstract: 本发明属于神经网络计算技术领域,为一种基于进化算法的自适应学习神经网络实现方法,以某种或者某几种已知的神经网络作为进化算法的最初父代,通过进化算法整合作为所述最初父代的各个神经网络的特点,从而得到最优的输出值,本发明通过对神经网络实现的电路进行二进制编码,将编码所得到的结果作为一个个体的染色体,各个染色体构成生物体的原始种群,即最初父代,本发明突破以往只是利用进化算法对神经网络权值进行寻优的情形,实现利用进化算法对神经网络组织形式、网络间的连接权值和网络计算方法等方式同时进行寻优,增强网络自由度,扩大寻优范围;初始得到一个较为简单的网络,在后天学习中,通过算法加大网络的复杂度。

    超标量处理器中指令相关性检测的方法

    公开(公告)号:CN105354117A

    公开(公告)日:2016-02-24

    申请号:CN201510702707.1

    申请日:2015-10-26

    Applicant: 清华大学

    CPC classification number: G06F11/2236

    Abstract: 超标量处理器中指令相关性检测的方法,通过设定一组锁定标识,指令解码后,将其源操作数与目的操作数分别与对应的锁定标识相比较,来判断指令的相关性与并行性;锁定标识根据每个周期指令的解码信息进行更新,每个周期更新一次;锁定标识与处理器内的通用寄存器组一一对应,每个通用寄存器都有一个对应的锁定标识;本发明不仅适用于检测同一周期内多条指令能否同时发射,也适用于检测不同流水级的各组指令之间的相关性;为实现指令的动态调度提供了基础的保证,而且该方法的实现并不会涉及很复杂的电路设计,能够很大程度上减小硬件开销。

    一种电动车窗防夹参数自学习方法

    公开(公告)号:CN103216172B

    公开(公告)日:2015-06-24

    申请号:CN201310174183.4

    申请日:2013-05-13

    Applicant: 清华大学

    Abstract: 本发明涉及一种电动车窗防夹参数自学习方法,包括以下步骤:车窗控制器通电后,启动车窗上升按钮,中断单元定时发送中断请求信号分别到电流采集器和霍尔计数器,直到车窗控制器断电,中断单元停止工作;判断单元判断车窗的运动过程是否构成一次合理的学习过程;在合理的学习过程中,车窗控制器对电机电流和车窗高度进行自学习,得到电流阈值和车窗高度;将自学习所得到的电流阈值和车窗高度进行存储;完成一次存储后,将车窗到过底的标志清除,在车窗到底停止后,将霍尔计数值置0,将自学习得到的参数设定为预设值,在车窗运行时,每通过定时中断,获得新的电流采样值和车窗高度与预设值进行比较,判断车窗的运动状态;在车窗不断运动过程中,对参数实时进行自学习,并根据新参数对车窗的状态进行实时判断。

    一种电动车窗防夹参数自学习方法

    公开(公告)号:CN103216172A

    公开(公告)日:2013-07-24

    申请号:CN201310174183.4

    申请日:2013-05-13

    Applicant: 清华大学

    Abstract: 本发明涉及一种电动车窗防夹参数自学习方法,包括以下步骤:车窗控制器通电后,启动车窗上升按钮,中断单元定时发送中断请求信号分别到电流采集器和霍尔计数器,直到车窗控制器断电,中断单元停止工作;判断单元判断车窗的运动过程是否构成一次合理的学习过程;在合理的学习过程中,车窗控制器对电机电流和车窗高度进行自学习,得到电流阈值和车窗高度;将自学习所得到的电流阈值和车窗高度进行存储;完成一次存储后,将车窗到过底的标志清除,在车窗到底停止后,将霍尔计数值置0,将自学习得到的参数设定为预设值,在车窗运行时,每通过定时中断,获得新的电流采样值和车窗高度与预设值进行比较,判断车窗的运动状态;在车窗不断运动过程中,对参数实时进行自学习,并根据新参数对车窗的状态进行实时判断。

    完成两次乘法两次加法两次位移的微处理器实现方法

    公开(公告)号:CN101615114B

    公开(公告)日:2012-07-18

    申请号:CN200910090204.8

    申请日:2009-07-31

    Applicant: 清华大学

    Inventor: 何虎 刘源

    Abstract: 本发明提出一种分支指令后将常数和程序计数器相加的微处理器实现方法,包括以下步骤:CALLD指令调用子程序,并根据目标寄存器或偏移量产生新的执行程序的地址,并将其存放于程序计数器PC;采用PUSH.PC指令将所述CALLD指令的返回地址压栈。通过本发明能够有效提高处理器的性能。

Patent Agency Ranking