基于优先级判定的深度流水线前向旁路

    公开(公告)号:CN117331603B

    公开(公告)日:2024-04-09

    申请号:CN202311199843.4

    申请日:2023-09-18

    IPC分类号: G06F9/38

    摘要: 本发明公开了一种基于优先级判定的深度流水线前向旁路,包括:旁路比较器,对输入的译码阶段的源寄存器标号与各个执行阶段的目的寄存器标号分别进行匹配比较,输出比较结果信号;旁路生成器,根据输入的译码阶段的源操作数有效信号、各个执行阶段的写回有效信号、以及旁路比较器输出的各个执行阶段对应的比较结果信号,输出旁路有效信号;优先级判别器,根据旁路生成器输出的各个执行阶段对应的旁路有效信号和各个执行阶段的优先级顺序,输出选择有效信号;数据选择器,根据输入的各个执行阶段的目的操作数、译码阶段的源寄存器操作数、以及优先级判别器输出的选择有效信号,输出旁路数据。本发明能够实现前向旁路的优先级判定,且易于实现。

    一种基于多访存模式感知学习的数据预取装置

    公开(公告)号:CN118260215A

    公开(公告)日:2024-06-28

    申请号:CN202410392224.5

    申请日:2024-04-02

    IPC分类号: G06F12/0862 G06F18/213

    摘要: 本发明公开了一种基于多访存模式感知学习的数据预取装置及方法,包括第一、第二、第三和第四数据预取模块,拼接查找模块和判断模块,其中第一数据预取模块用于根据固定步长的跨距模式,选取第一预取特征,形成第一特征向量;第二数据预取模块用于根据复杂跨距模式,选取第二预取特征,形成第二特征向量;第三数据预选模块用于根据全局流访问模式,选取第三预取特征,形成第三特征向量;第四数据预取模块用于根据顺序访存模式,选取默认特征值;拼接查找模块用于将上述特征向量进行拼接形成特征向量集,并将特征向量集作为整体特征查找项进行查找,判断模块用于对所选取的预取特征是否被使用进行判断,确定预取特征的最终命中结果。

    GPU多任务调度方法
    3.
    发明公开

    公开(公告)号:CN116909729A

    公开(公告)日:2023-10-20

    申请号:CN202310620267.X

    申请日:2023-05-30

    IPC分类号: G06F9/50

    摘要: 本发明公开了一种GPU多任务调度方法,该方法用于具有cluster结构的GPU,包括:当多个任务分配到GPU时,根据GPU的每个cluster结构中SM的空闲情况进行任务分配,在完成SM分配后开始运行任务;在任务运行阶段,根据任务的计算访存特征,实时调整cluster结构中分配给不同任务的SM。本发明的GPU多任务调度方法在任务到来时先根据SM空闲情况进行SM的初步分配,基于初步分配的SM运行任务,而后在任务运行阶段,根据任务的计算访存特征实时动态地调整分配给不同任务的SM,既能够提高片上网络资源的利用率,又能够缓解cluster网络端口的冲突,保证任务运行时的性能。

    基于对比学习的文本情感分类方法及系统

    公开(公告)号:CN118278368A

    公开(公告)日:2024-07-02

    申请号:CN202410064545.2

    申请日:2024-01-17

    摘要: 本发明公开了一种基于对比学习的文本情感分类方法及系统,该方法包括:获取待分类评论文本,确定对应的用户和商品,获取用户和商品的隐特征向量;利用神经网络语言模型获取待分类评论文本、用户历史评论文本、商品历史评论文本的特征向量;根据隐特征向量、用户历史评论文本的特征向量,利用第一注意力机制模型和用户权重阈值参数获取用户历史评论文本的加权和向量;根据隐特征向量、商品历史评论文本的特征向量,利用第二注意力机制模型和商品权重阈值参数获取商品历史评论文本的加权和向量;根据加权和向量,利用多层感知机和分类预测模型获取待分类评论文本的情感类别。本发明能够降低噪音文本的干扰,显著提高文本情感分类的精度。

    三维人体姿态的重建方法及装置
    5.
    发明公开

    公开(公告)号:CN117765164A

    公开(公告)日:2024-03-26

    申请号:CN202311576417.8

    申请日:2023-11-23

    摘要: 本发明提供一种三维人体姿态的重建方法及装置,涉及人工智能技术领域,其中,所述方法包括:将人体姿态图像输入至目标人体姿态重建模型,得到目标人体姿态重建模型输出的与人体姿态图像对应的三维人体姿态重建结果;目标人体姿态重建模型是基于人体姿态图像样本,利用模型剪枝策略对初始人体姿态重建模型进行模型剪枝并进行训练后得到的;模型剪枝策略包括以下至少一项:基于初始人体姿态重建模型的参数权重及特征进行模型剪枝;基于初始人体姿态重建模型的模型稀疏度及特征进行模型剪枝;基于特征及初始人体姿态重建模型的各网络层进行模型剪枝。通过上述方法,降低了三维人体姿态重建的功耗,实现了三维人体姿态重建算法在低功耗场景下的应用。

    用于GPU的cluster架构及其内部一级缓存管理方法

    公开(公告)号:CN116881192A

    公开(公告)日:2023-10-13

    申请号:CN202310660072.8

    申请日:2023-06-06

    IPC分类号: G06F15/78

    摘要: 本发明公开了一种用于GPU的cluster架构及其内部一级缓存管理方法,cluster架构包括:流处理器,包括多个,多个流处理器与交叉开关连接;交叉开关,具有多个输入端口和多个输出端口,多个输入端口分别与多个流处理器连接,多个输出端口分别与多个流处理器和GPU的片上互连网络连接,用于进行多个流处理器之间以及多个流处理器与片上互连网络之间的通信;L1索引路由模块,设置在交叉开关中,用于根据交叉开关接收到的流处理器发送的访存请求的地址计算对应的一级缓存的索引,并将访存请求通过交叉开关发送至包含有对应一级缓存的流处理器中。本发明能够实现cluster架构内部的各个流处理器的一级缓存共享,充分利用GPU中的一级缓存资源,提高流处理器和GPU的性能。

    基于优先级判定的深度流水线前向旁路

    公开(公告)号:CN117331603A

    公开(公告)日:2024-01-02

    申请号:CN202311199843.4

    申请日:2023-09-18

    IPC分类号: G06F9/38

    摘要: 本发明公开了一种基于优先级判定的深度流水线前向旁路,包括:旁路比较器,对输入的译码阶段的源寄存器标号与各个执行阶段的目的寄存器标号分别进行匹配比较,输出比较结果信号;旁路生成器,根据输入的译码阶段的源操作数有效信号、各个执行阶段的写回有效信号、以及旁路比较器输出的各个执行阶段对应的比较结果信号,输出旁路有效信号;优先级判别器,根据旁路生成器输出的各个执行阶段对应的旁路有效信号和各个执行阶段的优先级顺序,输出选择有效信号;数据选择器,根据输入的各个执行阶段的目的操作数、译码阶段的源寄存器操作数、以及优先级判别器输出的选择有效信号,输出旁路数据。本发明能够实现前向旁路的优先级判定,且易于实现。

    基于真值表译码的同时多线程轮询方法

    公开(公告)号:CN116880967A

    公开(公告)日:2023-10-13

    申请号:CN202310659952.3

    申请日:2023-06-06

    IPC分类号: G06F9/48 G06F30/39

    摘要: 本发明公开了一种基于真值表译码的同时多线程轮询方法及装置,该方法包括:获取当前时刻多个线程的请求信号和多个线程的令牌获得信号;根据当前时刻多个线程的请求信号和多个线程的令牌获得信号,利用真值表译码方式,确定下一时刻多个线程的令牌获得信号。本发明的基于真值表译码的同时多线程轮询方法及装置的处理过程简单,处理量少,可实现多线程的高效并发处理,能够显著降低对应电路的设计复杂性,降低电路结构面积和功耗的开销,提高处理器硬件资源的利用率。

    面向RISC-V向量定点指令的算术运算结构

    公开(公告)号:CN116627499A

    公开(公告)日:2023-08-22

    申请号:CN202310628299.4

    申请日:2023-05-31

    IPC分类号: G06F9/30 G06F7/544

    摘要: 本发明公开了一种面向RISC‑V向量定点指令的算术运算结构,包括用于对所输入的数据进行乘法运算的乘法模块;用于接收乘法模块所运算输出的数据和外部输入的数据及外部交换信号并进行交换输出的交换模块;用于接收交换模块中输出的交换数据并进行加减运算的加法模块;选择器包括第一、第二、第三和第四选择器;用于接收加法模块输出数据及外部信号并进行选择操作的选择模块;用于接收第一和第二选择器和加法模块中输出的数据并进行进位或舍去操作的舍入操作模块;用于接收加法模块输出的数据及归约或后输出的数据并进行比较运算的比较模块;用于接收舍入操作模块输出进位或舍去操作后的数据和外部的饱和有效信号并进行饱和操作运算的饱和操作模块。