针对循环体的体系结构优化方法及装置

    公开(公告)号:CN114116010A

    公开(公告)日:2022-03-01

    申请号:CN202210096815.9

    申请日:2022-01-27

    Abstract: 本公开提供了针对循环体的体系结构优化方法及装置,该方法包括:判断当前指令是否为短循环体指令,若是,则将当前指令缓存在短循环体缓存中;对当前指令的PC值进行查表,若表中存在有效的记录相匹配,则确定当前指令为控制循环体的条件分支指令,从表中相应的jump_pc处开始预取后续指令。本公开提供的针对循环体的体系结构优化方法及装置,能够更低功耗且更高效快速地取出短循环体分支指令,降低了流水线中空泡的概率,从而尽可能地避免了流水线因为取指慢而造成的内核性能低的问题;实现了更准确的循环体预测,并且能够快速检测循环体控制用的条件分支指令,减少了流水线冲刷的频率,提高了处理器的性能。

    一种流水线式计算加速协处理方法及系统

    公开(公告)号:CN112286581A

    公开(公告)日:2021-01-29

    申请号:CN202011559719.0

    申请日:2020-12-25

    Abstract: 本发明公开了一种流水线式计算加速协处理方法,该方法应用于计算加速协处理系统,该系统包括分别用于执行不同级别运算的多个计算单元,接收待计算的多个运算组,对运算组解析生成待运算次数和每一级运算的操作数;将每一级运算的操作数经过数据通路进行操作数准备,并配置关联级别的计算标识;根据待运算次数为每一运算组分配多个不同级别的计算单元并为多个不同级别的计算单元分别需要执行的运算次数;根据计算标识和所述计算单元需要执行的运算次数执行每一级别的计算单元至计算结束生成最终计算结果输出。本发明还公开了一种流水线式计算加速协处理系统。根据本发明公开的方法和系统能够大幅提高计算的吞吐和计算时隙,提高了计算单元的效率。

    一种指令的生成方法、装置以及电子设备

    公开(公告)号:CN112230995A

    公开(公告)日:2021-01-15

    申请号:CN202011093577.3

    申请日:2020-10-13

    Abstract: 本申请公开了一种指令的生成方法、装置以及电子设备,所述方法应用于编译器,所述编译器与DSP处理系统连接,该方法包括:在接收源代码时,从源代码中确定能向量化的循环体,并对循环体的指令作向量化处理生成SIMD指令;按照超长指令集架构将SIMD指令拼接成执行指令集;向DSP处理系统发送执行指令集,以使DSP处理系统对数据执行测试处理。本申请可以确定能进行并行处理的数据,对数据进行向量化处理并生成多个SIMD指令,将多个SIMD指令拼接成一个可并行处理的超长指令集架构,使得DSP处理系统可以在通过超长指令集架构同时接收多个SIMD指令,并行响应多个SIMD指令,从而可以提高数据处理效率。

    一种报文编辑方法、装置及计算机可读存储介质

    公开(公告)号:CN111818098B

    公开(公告)日:2020-12-11

    申请号:CN202010901433.X

    申请日:2020-09-01

    Abstract: 本发明公开了一种报文编辑方法、装置及计算机可读存储介质,所述方法包括获取待编辑报文数据及有效字段标志信息;其中,有效字段标志信息用于标识新协议报文中所要包含的各个新报文头字段;根据预设的报文头字段编辑表及有效字段标志信息,确定各新报文头字段在描述符总线的总线位置信息,并根据各新报文头字段的总线位置信息从描述符总线中提取各新报文头字段;根据各新报文头字段构建新协议报文的报文头,并将新协议报文的报文头与待编辑报文数据的报文实体进行组合,生成新协议报文。通过实施本发明的实施例能够实现报文类型的转化构建基于新协议的报文。

    基于FPGA的原型验证平台的高频差分系统

    公开(公告)号:CN117851268A

    公开(公告)日:2024-04-09

    申请号:CN202410256943.4

    申请日:2024-03-07

    Inventor: 廖述京

    Abstract: 本申请公开了基于FPGA的原型验证平台、服务器及差分测试系统。该原型验证平台包括:运行模块用于运行被测处理器内核;第一缓存模块用于接收运行模块发送的运行被测处理器内核产生的增量架构数据;第二缓存模块用于缓存被测处理器内核运行过程中作为探针信号的目标信号的波形数据;第一通信模块用于将增量架构数据发送至服务器,以使服务器根据增量架构数据进行差分测试;第一通信模块还用于接收服务器发送的触发信号;触发信号由服务器在差分测试结果异常时产生;第二缓存模块响应于触发信号,通过第二通信模块将目标信号的波形数据导出至服务器。通过上述方式,能够减少传输流量,提高服务器的差分测试效率。

    一种针对处理器循环体的体系结构优化方法及装置

    公开(公告)号:CN114116010B

    公开(公告)日:2022-05-03

    申请号:CN202210096815.9

    申请日:2022-01-27

    Abstract: 本公开提供了一种针对处理器循环体的体系结构优化方法及装置,该方法包括:判断当前指令是否为短循环体指令,若是,则将当前指令缓存在短循环体缓存中;对当前指令的PC值进行查表,若表中存在有效的记录相匹配,则确定当前指令为控制循环体的条件分支指令,从表中相应的jump_pc处开始预取后续指令。本公开提供的一种针对处理器循环体的体系结构优化方法及装置,能够更低功耗且更高效快速地取出短循环体分支指令,降低了流水线中空泡的概率,从而尽可能地避免了流水线因为取指慢而造成的内核性能低的问题;实现了更准确的循环体预测,并且能够快速检测循环体控制用的条件分支指令,减少了流水线冲刷的频率,提高了处理器的性能。

    一种矩阵乘法器的实现方法及矩阵乘法器装置

    公开(公告)号:CN113032723B

    公开(公告)日:2021-08-10

    申请号:CN202110568171.4

    申请日:2021-05-25

    Abstract: 本发明公开了一种矩阵乘法器的实现方法,方法包括:配置第一乘法运算模块、第二乘法运算模块、保留进位加法运算模块和超前进位加法运算模块;将待运算的多个乘数根据矩阵乘法运算的需求分割成满足第一乘法运算模块和第二乘法运算模块所需的小矩阵;通过小矩阵进行矩阵的乘法运算生成多个部分积;通过保留进位加法运算模块对多个部分积根据不同的权重进行压缩至两个部分积;通过超前进位加法运算模块对两个部分积进行运算生成用于组成矩阵乘法结果的元素。根据本发明公开的方法能够减少矩阵运算所需的时钟周期,提高了计算模块的利用效率,减少了运算资源的浪费。

    一种报文编辑方法、装置及计算机可读存储介质

    公开(公告)号:CN111818098A

    公开(公告)日:2020-10-23

    申请号:CN202010901433.X

    申请日:2020-09-01

    Abstract: 本发明公开了一种报文编辑方法、装置及计算机可读存储介质,所述方法包括获取待编辑报文数据及有效字段标志信息;其中,有效字段标志信息用于标识新协议报文中所要包含的各个新报文头字段;根据预设的报文头字段编辑表及有效字段标志信息,确定各新报文头字段在描述符总线的总线位置信息,并根据各新报文头字段的总线位置信息从描述符总线中提取各新报文头字段;根据各新报文头字段构建新协议报文的报文头,并将新协议报文的报文头与待编辑报文数据的报文实体进行组合,生成新协议报文。通过实施本发明的实施例能够实现报文类型的转化构建基于新协议的报文。

    一种图像快速去雾方法、装置、终端及存储介质

    公开(公告)号:CN111145105A

    公开(公告)日:2020-05-12

    申请号:CN201911230486.7

    申请日:2019-12-04

    Inventor: 廖述京

    Abstract: 本发明公开了一种图像快速去雾方法、装置、终端及存储介质,方法:通过天空区域识别算法,将原始有雾图像划分为天空区域和非天空区域;通过CLAHE增强算法,对天空区域进行CLAHE增强,得到天空区域的去雾图像;通过改进的暗通道理论,对非天空区域首先分别进行暗原色增强和CLAHE增强,然后取两者均值以增强对比度和亮度,得到非天空区域的去雾图像;对天空区域的去雾图像和非天空区域的去雾图像进行去雾复原处理,得到原始有雾图像对应的去雾图像。本发明能够有效避免现有技术对天空区域失效的问题,减少计算大气光值过程中的排序与循环遍历问题,有利于算法在硬件上实现,同时能达到亮度合适、细节明显、整体图像均衡、色彩不失真的效果。

Patent Agency Ranking