跨系统设备调用架构及方法
    1.
    发明公开

    公开(公告)号:CN118860655A

    公开(公告)日:2024-10-29

    申请号:CN202411026823.1

    申请日:2024-07-30

    IPC分类号: G06F9/50

    摘要: 本申请涉及一种跨系统设备调用架构及方法,应用在硬件设备调用领域,包括管理机管理所有系统节点;若干系统节点均连接于管理机,获取并处理待处理任务;系统节点包括应用程序,系统内核和硬件设备;应用程序获取待处理任务;系统内核连接于应用程序,计算待处理任务需要的硬件资源,并将待处理任务分配至硬件设备处理;硬件设备连接于系统内核,用于处理待处理任务;系统内核包括设备共享层和驱动程序;设备共享层用于代理本地的硬件设备的访问控制,提供跨系统的硬件设备的访问控制,并与管理机交互;驱动程序连接于设备共享层,用于驱动硬件设备运行。本申请具有的技术效果是:跨系统设备调用,避免不同层之间多次拷贝,提升系统架构性能。

    基于阵列结构的融合缓冲架构

    公开(公告)号:CN118519960A

    公开(公告)日:2024-08-20

    申请号:CN202410969196.9

    申请日:2024-07-19

    摘要: 本申请公开基于阵列结构的融合缓冲架构,涉及缓冲器领域,包括缓冲阵列以及与缓冲阵列通过信号线连接的指令模块;指令模块中缓存有编译完成的指令数据,根据时序向缓冲阵列发送指令流;缓冲阵列中包含M行结构相同的缓冲块,相邻行缓冲块之间通过单向指令信号线依次级联,将指令模块送入的指令流根据时序向M行缓冲块逐行传递;M行缓冲块分别设置有数据输入端和数据输出端,分别接收外部数据输入,根据传递到本行的指令数据执行缓存和输出任务。使用sram的阵列单元,采用流水寄存器代替传统总线设计,采用多指令槽控制数据读写传输,实现了与设计规模无关的全局统一管理和存取的缓冲架构,降低了电路设计难度,提升了数据缓存和读写效率。

    数据加速流水同步环
    3.
    发明公开

    公开(公告)号:CN118484143A

    公开(公告)日:2024-08-13

    申请号:CN202410634534.3

    申请日:2024-05-22

    IPC分类号: G06F3/06 G06F5/06 G06F15/173

    摘要: 本申请公开数据加速流水同步环,涉及加速器领域,流水同步环与加速器中的N个计算核组连接,包含M个级联的前向传输块和M个级联的后向传输块;位于首端的前向传输块和尾端的前向传输块分别连接加速器的数据接收模块和数据发送模块;位于尾端的前向传输块的输出级联位于首端的后向传输块;第i个前向传输块和第M‑i+1个后向传输块相互对应,形成一个前后传输组,且每个前后传输组共同连接至少一个计算核组,将数据根据时钟周期,并以流水形式送入目标计算核组进行计算,以及将计算核组输出的数据送入流水同步环。该架构的加速器取代了传统多级cache结构,降低了多层搜索造成的时延,加快加速器内部和加速器之间的计算速率。

    卷积神经网络加速方法、装置、设备及存储介质

    公开(公告)号:CN118396061A

    公开(公告)日:2024-07-26

    申请号:CN202410514133.4

    申请日:2024-04-26

    IPC分类号: G06N3/063 G06N3/0464

    摘要: 本申请涉及一种卷积神经网络加速方法、装置、设备及存储介质,应用在人工智能技术领域,包括获取目标数据,所述目标数据为需要进行卷积神经网络处理的数据;将所述目标数据挂载到所述同步动态随机存储器,并将所述同步动态随机存储器放置到所述超级逻辑域块;将所述卷积神经网络核放置到所述超级逻辑域块;在接收到开始计算的执行信号时,通过所述卷积神经网络核进行卷积神经网络处理,计算所述目标数据并得到运算结果。本申请具有的技术效果是:提升工作时钟频率,充分发挥硬件已有的逻辑资源,最大程度的提升卷积神经网络核的算力性能。

    面向向量数据库的混合加速架构

    公开(公告)号:CN117951346B

    公开(公告)日:2024-05-28

    申请号:CN202410349055.7

    申请日:2024-03-26

    IPC分类号: G06F16/903

    摘要: 本申请公开面向向量数据库的混合加速架构,涉及集成电路领域,包括主核和两个副核,主核中任务切分模块进行任务切分,任务调度模块根据调度副核执行加速任务;第一副核根据切分任务执行距离计算流水线,其中的距离计算模块根据向量库和待查询向量计算向量距离,从高速存储器中提取待查询向量和向量库、缓存向量距离,向主核反馈距离计算流水线的计算结果;第二副核根据切分任务执行排序流水线,其中的数据排序模块根据向量距离进行向量排序,向主核反馈排序流水线的排序结果,主核根据排序结果输出向量查询结果。该方案通过硬件实现多流水并行处理,实现各种模式下的混合加速功能,副核自定义加速功能,提供更快处理速度和更高存储访问带宽。

    流式张量处理器
    6.
    发明公开

    公开(公告)号:CN117992396A

    公开(公告)日:2024-05-07

    申请号:CN202410374090.4

    申请日:2024-03-29

    摘要: 本申请公开流式张量处理器,涉及芯片领域,向量计算模块、数据存取模块、数据交换模块和矩阵计算模块组成对称结构,每个模块都配备有独立的指令单元和功能单元,且功能单元中包含n层结构相同的功能块,指令单元根据时序缓存指令流并输入到功能块中,同层级功能块之间互联,实现横向数据传输,指令流在纵向控制功能单元和其中的功能块执行对应的功能操作;数据交换单元分别通过控制总线连接内存控制器和外部存储器实现数据输入输出。该结构相同功能单元共享一套指令电路,节省指令电路;不同的功能单元之间采用流水式数据传输,无需总线,通讯延时低、效率高。相同模块电路设计完全一致,提高逻辑和物理电路复用率,降低芯片设计难度。

    一种可编程AI实现方法、装置、设备及存储介质

    公开(公告)号:CN117971189A

    公开(公告)日:2024-05-03

    申请号:CN202410255274.9

    申请日:2024-03-06

    IPC分类号: G06F8/33 G06F8/35 G06F8/10

    摘要: 本申请涉及一种可编程AI实现方法、装置、设备及存储介质,应用在AI实现领域,其中方法包括:控制单元根据编码指令生成模型对应的配置信息并烧写,在获取到程序的启动指令时确定使能的算子模块;接口单元将模型数据经由预设的输入缓存区发送至数据转换单元;数据转换单元确定模型数据中的有效数据并提取,对有效数据进行分流;预处理单元读取输出缓存区中的预处理数据,使用使能的算子模块依次对预处理数据进行预处理;AI计算单元对数据进行计算,获取结果数据,将结果数据经由接口单元输出。本申请具有的技术效果是:最大限度地提高了系统的处理效率和资源利用率,实现对数据的针对性处理,可以根据不同模型的特性进行个性化定制。

    在线内存扩展方法、装置、设备及存储介质

    公开(公告)号:CN117806570B

    公开(公告)日:2024-05-03

    申请号:CN202410226278.4

    申请日:2024-02-29

    摘要: 本申请涉及一种在线内存扩展方法、装置、设备及存储介质,应用在计算机存储领域,包括设置所述SSD存储器所支持的标准协议,并对每个所述SSD存储器配置单独的DMA通道;将所述SSD存储器的逻辑地址与在线内存地址进行映射对应;获取待写入的数据以及所述待写入的数据对应的目标在线内存地址,将所述待写入的数据以及所述目标在线内存地址缓存至所述高带宽存储器;将所述高带宽存储器中缓存的数据同步至所述SSD存储器的所述逻辑地址中。本申请具有的技术效果是:扩展在线内存,降低延时,同时可以降低在线内存扩展方案实现的成本。

    大语言模型长文本输出方法、装置、设备及存储介质

    公开(公告)号:CN117933270A

    公开(公告)日:2024-04-26

    申请号:CN202410340500.3

    申请日:2024-03-25

    IPC分类号: G06F40/30 G06F40/279

    摘要: 本申请公开大语言模型长文本输出方法、装置、设备及存储介质,涉及处理器领域,根据提示语的语义信息提取并保存对应的KV值;提取长文本持续输出时的第i轮KV值并计算第i轮词元,根据该轮词元生成文本信息;确定第i轮KV值对应的第i轮KV集合的长度,根据集合长度将KV集合以文本生成顺序进行切分和过滤,获得第i+1轮KV值的KV集合;将第i+1轮KV值替换显存中的第i轮KV值,并生成第i+1轮词元和生成对应文本信息。该方案将累计的KV值根据时间切分,每轮迭代对邻近部分保留,远离部分适当筛选后组成新的集合,将每轮迭代的KV值压缩后大幅减小显存同时,又保留长文本输出前后语义信息间的关联性。

    向量处理方法、装置、设备及存储介质

    公开(公告)号:CN117456210A

    公开(公告)日:2024-01-26

    申请号:CN202311504566.3

    申请日:2023-11-13

    摘要: 本申请涉及一种向量处理方法、装置、设备及存储介质,应用在缺陷检测领域,包括获取缺陷样本图像及待检索的向量库;提取缺陷样本图像的缺陷特征向量并设为目标向量;对原始向量聚类,提取若干聚类中心;将若干原始向量设为原始检索向量;将若干聚类中心存储到内存单元,将原始检索向量存储到硬盘单元;对若干聚类中心进行图检索,根据图检索结果对若干聚类中心排序,将排序靠前的若干聚类中心设为相似聚类中心;读取硬盘单元中与相似聚类中心对应的原始检索向量并设为相似聚类向量;对相似聚类向量暴力检索,提取并输出相似度最高的相似聚类向量。本申请具有的效果:解决高内存占用问题,提高检索精度,找到与给定样本间最相似的缺陷样本。