一种实现处理器与DMA设备数据一致性的方法及装置

    公开(公告)号:CN114153767A

    公开(公告)日:2022-03-08

    申请号:CN202210123305.6

    申请日:2022-02-10

    Abstract: 本公开提供了一种实现处理器与DMA设备数据一致性的方法及装置,该方法包括:当DMA设备发起写请求时,将cache中对应的cacheline无效化,将无效化后的cacheline信息发送至预先设置的DMAcache;将保存过的cacheline状态更新为不可写,通知DMA设备可以开始写入,在DMA设备完成写操作后,将DMAcache中对应的cacheline状态更新为可写。本公开提供的一种实现处理器与DMA设备数据一致性的方法及装置,通过添加DMA cache,保证DMA设备写入时主存储器与cache的数据的一致性,规避了第二次cacheline无效化的操作,提高了处理器的效率,降低了固件成本,同时降低了开发和调试成本。

    一种流水线式计算加速协处理方法及系统

    公开(公告)号:CN112286581B

    公开(公告)日:2021-05-28

    申请号:CN202011559719.0

    申请日:2020-12-25

    Abstract: 本发明公开了一种流水线式计算加速协处理方法,该方法应用于计算加速协处理系统,该系统包括分别用于执行不同级别运算的多个计算单元,接收待计算的多个运算组,对运算组解析生成待运算次数和每一级运算的操作数;将每一级运算的操作数经过数据通路进行操作数准备,并配置关联级别的计算标识;根据待运算次数为每一运算组分配多个不同级别的计算单元并为多个不同级别的计算单元分别需要执行的运算次数;根据计算标识和所述计算单元需要执行的运算次数执行每一级别的计算单元至计算结束生成最终计算结果输出。本发明还公开了一种流水线式计算加速协处理系统。根据本发明公开的方法和系统能够大幅提高计算的吞吐和计算时隙,提高了计算单元的效率。

    一种基于表面等离子体激元的广角光接收器

    公开(公告)号:CN112003649A

    公开(公告)日:2020-11-27

    申请号:CN202010829687.5

    申请日:2020-08-17

    Abstract: 本发明公开了一种基于表面等离子体激元的广角光接收器,接收器本体,所述接收器本体的顶部开口,所述接收器本体内设有与所述开口连通的接收腔;所述接收腔的腔底设有透射小孔和围绕所述透射小孔分布的若干条第一环状凹槽,若干条所述第一环状凹槽的半径沿所述透射小孔至所述接收腔的腔壁的方向依次增大;所述接收腔的腔壁上布设有若干条第二环状凹槽,若干条所述第二环状凹槽的半径沿所述接收腔的底部至所述开口的方向依次增大。本发明实施例提供的基于表面等离子体激元的广角光接收器,通过设计广角光接收器的亚波长结构并基于不同的中心波长确定各个参数的最优值,增大响应角度和光增益,提高广角性能。

    矩阵求逆方法、装置、设备及计算机可读存储介质

    公开(公告)号:CN110377875A

    公开(公告)日:2019-10-25

    申请号:CN201910643162.X

    申请日:2019-07-16

    Inventor: 廖述京

    Abstract: 本发明公开了一种矩阵求逆方法,包括:在接收到矩阵求逆请求时,获取矩阵A;将矩阵A分解为下三角矩阵L和上三角矩阵U,并根据第一预设规则存储下三角矩阵L对应的第一矩阵元素lij和上三角矩阵U对应的第二矩阵元素uij;获取存储的第一矩阵元素lij和第二矩阵元素uij并行处理,得到下三角矩阵L对应的下三角逆矩阵L-1,和上三角矩阵U对应的上三角逆矩阵U-1;根据第二预设规则存储下三角逆矩阵L-1对应的第三矩阵元素ltij,和上三角逆矩阵U-1对应的第四矩阵元素utij;获取存储的第三矩阵元素ltij和第四矩阵元素utij并处理,得到矩阵A对应逆矩阵A-1的逆矩阵元素fij。本发明还公开了一种矩阵求逆装置、设备和计算机可读存储介质。本发明提高了矩阵求逆的效率。

    一种提高处理器缓存命中率的方法及装置

    公开(公告)号:CN114116534B

    公开(公告)日:2022-05-06

    申请号:CN202210096816.3

    申请日:2022-01-27

    Abstract: 本公开提供了一种提高处理器缓存命中率的方法及装置,该方法包括:步骤1:绘制超标量处理器的程序控制流图,程序控制流图中每个程序块有两个结束节点,结束节点为当前程序块下一拍将要被执行的下一程序块;步骤2:将当前程序块及当前程序块下一拍将要被执行的全部下一程序块均加载至cache;步骤3:根据当前程序块遍历执行路径,根据遍历后的结果在cache中选择下一程序块执行。本公开提供的一种提高处理器缓存命中率的方法及装置,通过超标量处理器的程序控制流图,将当前执行的程序块及下一个要执行的程序块提前放入cache中,使得cache中总会有个程序块可以处在执行中,极大提高了缓存的命中率,提高了超标量处理器性能。

    一种用于自动验证处理器系统场景的方法

    公开(公告)号:CN114117977A

    公开(公告)日:2022-03-01

    申请号:CN202210096817.8

    申请日:2022-01-27

    Abstract: 本发明公开了一种用于自动验证处理器系统场景的方法,该方法包括:接入待验证的系统级别,根据待验证的系统级别启动对应的验证线程;在验证线程下选择适配于待验证的系统级别的待测模块;通过待测模块自动加载满足系统场景的参考模型进行验证并生成验证结果;其中,待验证的系统级别至少包括模块级或系统级。由此能够在不同层次待测待测级别中,利用原有已编写好的验证代码,自动生成相应的验证平台,改善了模块级或系统级在验证场景下的垂直复用问题。

    一种用于实现自增指令的方法及系统

    公开(公告)号:CN113254079B

    公开(公告)日:2021-10-01

    申请号:CN202110716307.1

    申请日:2021-06-28

    Abstract: 本发明公开了一种用于实现自增指令的方法,包括:利用写入自增指令的逻辑寄存器映射关联的物理寄存器作为自增指令的基地址寄存器;构建自增指令基地址寄存器的专用忙表,至少包括所有物理寄存器和所有物理寄存器对应的工作状态信息,所有物理寄存器添加有ID属性;根据接收的自增指令查询自增指令基地址寄存器的专用忙表,更改物理寄存器对应的工作状态信息;通过更改后的自增指令基地址寄存器的专用忙表和预置的非自增指令寄存器的忙表确定自增指令的基地址寄存器的最终工作状态信息;根据自增指令的基地址寄存器的最终工作状态信息判断是否唤醒自增指令的发射状态;通过发射槽接收自增指令的发射状态,并依次发射。由此提高了程序的执行性能。

    一种矩阵乘法器的实现方法及矩阵乘法器装置

    公开(公告)号:CN113032723A

    公开(公告)日:2021-06-25

    申请号:CN202110568171.4

    申请日:2021-05-25

    Abstract: 本发明公开了一种矩阵乘法器的实现方法,方法包括:配置第一乘法运算模块、第二乘法运算模块、保留进位加法运算模块和超前进位加法运算模块;将待运算的多个乘数根据矩阵乘法运算的需求分割成满足第一乘法运算模块和第二乘法运算模块所需的小矩阵;通过小矩阵进行矩阵的乘法运算生成多个部分积;通过保留进位加法运算模块对多个部分积根据不同的权重进行压缩至两个部分积;通过超前进位加法运算模块对两个部分积进行运算生成用于组成矩阵乘法结果的元素。根据本发明公开的方法能够减少矩阵运算所需的时钟周期,提高了计算模块的利用效率,减少了运算资源的浪费。

    一种并行双通道的cache设计方法和装置

    公开(公告)号:CN111736900A

    公开(公告)日:2020-10-02

    申请号:CN202010822426.0

    申请日:2020-08-17

    Abstract: 本申请公开了一种并行双通道的cache设计方法和装置,在流水阶段一时,获取双通道新入队的两个新指令的地址,并对新指令的地址与双通道入队之前的老指令的所有地址进行地址冲突检测,并根据冲突指令的不同,执行不同的操作;在流水阶段二时,比较新指令的tag区域与L1 cache的tag区域,得到新指令的命中或失靶信息;在流水阶段三时,根据新指令是否已操作完毕、是否命中L1 cache,进行相应的操作,从而解决了现有的单通道cache设计中读或写指令共用一个存储通道,限制了存储指令的并行执行,使得处理器乱序执行的效率较低的技术问题。

    一种图像快速去雾方法、装置、终端及存储介质

    公开(公告)号:CN111145105B

    公开(公告)日:2020-09-01

    申请号:CN201911230486.7

    申请日:2019-12-04

    Inventor: 廖述京

    Abstract: 本发明公开了一种图像快速去雾方法、装置、终端及存储介质,方法:通过天空区域识别算法,将原始有雾图像划分为天空区域和非天空区域;通过CLAHE增强算法,对天空区域进行CLAHE增强,得到天空区域的去雾图像;通过改进的暗通道理论,对非天空区域首先分别进行暗原色增强和CLAHE增强,然后取两者均值以增强对比度和亮度,得到非天空区域的去雾图像;对天空区域的去雾图像和非天空区域的去雾图像进行去雾复原处理,得到原始有雾图像对应的去雾图像。本发明能够有效避免现有技术对天空区域失效的问题,减少计算大气光值过程中的排序与循环遍历问题,有利于算法在硬件上实现,同时能达到亮度合适、细节明显、整体图像均衡、色彩不失真的效果。

Patent Agency Ranking