一种基于多访存模式感知学习的数据预取装置

    公开(公告)号:CN118260215A

    公开(公告)日:2024-06-28

    申请号:CN202410392224.5

    申请日:2024-04-02

    IPC分类号: G06F12/0862 G06F18/213

    摘要: 本发明公开了一种基于多访存模式感知学习的数据预取装置及方法,包括第一、第二、第三和第四数据预取模块,拼接查找模块和判断模块,其中第一数据预取模块用于根据固定步长的跨距模式,选取第一预取特征,形成第一特征向量;第二数据预取模块用于根据复杂跨距模式,选取第二预取特征,形成第二特征向量;第三数据预选模块用于根据全局流访问模式,选取第三预取特征,形成第三特征向量;第四数据预取模块用于根据顺序访存模式,选取默认特征值;拼接查找模块用于将上述特征向量进行拼接形成特征向量集,并将特征向量集作为整体特征查找项进行查找,判断模块用于对所选取的预取特征是否被使用进行判断,确定预取特征的最终命中结果。

    减少GPU片上互连网络拥塞的GPU优化方法

    公开(公告)号:CN117608816A

    公开(公告)日:2024-02-27

    申请号:CN202311349147.7

    申请日:2023-10-18

    IPC分类号: G06F9/50 G06F15/78

    摘要: 本发明公开了一种减少GPU片上互连网络拥塞的GPU优化方法,其特征在于,包括:将若干流处理器划分为若干集群;对GPU应用程序访存局部特性进行分析,相邻线程块block存在对同一个cache行的访问;提出将来自同一个集群的不同流处理器访问同一个cache行的冗余请求进行合并处理的方法,通过分析GPU应用程序访存局部性特点,不同的block的请求会访问同一个cache行的基础上,将来自同一个集群不同SM的冗余请求进行合并,从而达到减少网络拥塞,提高GPU性能的目的。

    GPU多任务调度方法
    3.
    发明公开

    公开(公告)号:CN116909729A

    公开(公告)日:2023-10-20

    申请号:CN202310620267.X

    申请日:2023-05-30

    IPC分类号: G06F9/50

    摘要: 本发明公开了一种GPU多任务调度方法,该方法用于具有cluster结构的GPU,包括:当多个任务分配到GPU时,根据GPU的每个cluster结构中SM的空闲情况进行任务分配,在完成SM分配后开始运行任务;在任务运行阶段,根据任务的计算访存特征,实时调整cluster结构中分配给不同任务的SM。本发明的GPU多任务调度方法在任务到来时先根据SM空闲情况进行SM的初步分配,基于初步分配的SM运行任务,而后在任务运行阶段,根据任务的计算访存特征实时动态地调整分配给不同任务的SM,既能够提高片上网络资源的利用率,又能够缓解cluster网络端口的冲突,保证任务运行时的性能。

    基于多任务协同学习的文本情感分析方法

    公开(公告)号:CN116561310A

    公开(公告)日:2023-08-08

    申请号:CN202310373551.1

    申请日:2023-04-10

    IPC分类号: G06F16/35 G06N3/048 G06N3/08

    摘要: 本发明公开了一种基于多任务协同学习的文本情感分析方法,包括:获取待测文本,确定待测文本对应的嵌入式特征向量;对嵌入式特征向量进行处理,获取对应于方面术语提取的第一词组卷积特征向量和对应于方面类别检测的第二词组卷积特征向量;根据第一词组卷积特征向量和第二词组卷积特征向量,获取第一共享特征向量和第二共享特征向量;根据词组卷积特征向量和共享特征向量,获取词组的第一专有特征向量和隐特征向量;对第一共享特征向量和词组的隐特征向量进行处理,获取第二专有特征向量;根据词组的第一专有特征向量确定方面术语提取的预测结果,根据第二专有特征向量确定方面类别检测的预测结果。本发明能提高方面术语提取和方面类别检测精度。

    商品用户评论文本的情感分类方法及系统

    公开(公告)号:CN111666410B

    公开(公告)日:2022-01-28

    申请号:CN202010473656.0

    申请日:2020-05-29

    摘要: 本发明公开了一种商品用户评论文本的情感分类方法及系统,该方法包括:获取一个商品用户评论文本,对文本对应用户的行为特征和商品的属性特征间的交互进行建模,获取用户与商品的交互信息;确定评论文本的语义信息;确定商品的其余评论本文对应的其余用户的行为特征,确定用户与其余用户间的行为特征相似性,选择与用户的行为特征相似性最大的若干个用户对应的评论文本作为辅助文本,确定辅助文本的语义信息;获取评论文本的融合语义信息;基于融合语义信息和用户与商品的交互信息,确定评论文本的情感类别。本发明的方法及系统在评论文本的基础上结合用户的行为特征、商品的属性特征和辅助文本,进行评论文本的情感分类,能显著提高分类精度。

    混合指令拼接方法
    7.
    发明公开

    公开(公告)号:CN118152005A

    公开(公告)日:2024-06-07

    申请号:CN202410192235.9

    申请日:2024-02-21

    IPC分类号: G06F9/30

    摘要: 本发明公开了一种混合指令拼接方法,包括:获取高速缓存块,确定输出指令数量;分别将高速缓存块拆分为多条32位原始指令和多条16位指令,获取有效标志信号和压缩标志信号;根据压缩标志信号的第m+2n位是否为真、有效标志信号的第m+2n位是否为真、有效标志信号的第m+2n+1位是否为真,将第m+2n+1条指令的解压缩指令、或第m+2n+1条指令与第m+2n+2条指令的拼接指令、或第i条原始指令作为第i条输出指令,得到并输出I条输出指令,m表示前i‑1条输出指令中由压缩指令确定的输出指令的数量,n表示前i‑1条输出指令中由非压缩指令确定的输出指令的数量。本发明能根据高速缓存块快速、准确地得到输出指令,无需列举所有可能情况,处理过程简单,有效地简化所需设计的芯片结构。

    面向原子指令的硬件循环装置及实现方法

    公开(公告)号:CN117421042A

    公开(公告)日:2024-01-19

    申请号:CN202311212583.X

    申请日:2023-09-20

    IPC分类号: G06F9/30

    摘要: 本发明公开了一种面向原子指令的硬件循环装置及实现方法,包括:指令译码器,用于接收指令,对指令进行译码,判断是否为原子操作指令,向地址控制器发送微码起始地址,向微码控制器发送有效信号;地址控制器,用于生成微码地址,将微码地址发送至微码存储器;微码存储器,用于获取微码,将微码发送至微码控制器;微码控制器,用于将微码及微码地址发送至流水线,对微码进行译码,判断是否为sc指令,根据sc指令执行结果生成地址控制信号发送至地址控制器,根据引退地址和冲刷信号判断是否结束原子指令的硬件循环操作,根据译码结果生成地址控制信号发送至地址控制器或结束硬件循环操作。本发明能够通过硬件循环实现原子操作指令,避免修改编译器。

    基于优先级判定的深度流水线前向旁路

    公开(公告)号:CN117331603A

    公开(公告)日:2024-01-02

    申请号:CN202311199843.4

    申请日:2023-09-18

    IPC分类号: G06F9/38

    摘要: 本发明公开了一种基于优先级判定的深度流水线前向旁路,包括:旁路比较器,对输入的译码阶段的源寄存器标号与各个执行阶段的目的寄存器标号分别进行匹配比较,输出比较结果信号;旁路生成器,根据输入的译码阶段的源操作数有效信号、各个执行阶段的写回有效信号、以及旁路比较器输出的各个执行阶段对应的比较结果信号,输出旁路有效信号;优先级判别器,根据旁路生成器输出的各个执行阶段对应的旁路有效信号和各个执行阶段的优先级顺序,输出选择有效信号;数据选择器,根据输入的各个执行阶段的目的操作数、译码阶段的源寄存器操作数、以及优先级判别器输出的选择有效信号,输出旁路数据。本发明能够实现前向旁路的优先级判定,且易于实现。

    用于GPU的NoC仲裁方法
    10.
    发明公开

    公开(公告)号:CN116957902A

    公开(公告)日:2023-10-27

    申请号:CN202310848547.6

    申请日:2023-07-12

    IPC分类号: G06T1/20 G06F9/50

    摘要: 本发明公开了一种用于GPU的NoC仲裁方法,用于GPU,包括:响应于程序的执行,在流处理器发送到片上互连网络的访存请求中编码当前流处理器中到达barrier的线程束数目;根据访存请求对应的输出端口,将片上互连网络接收的访存请求划分为多组以使每组中的访存请求对应的输出端口相同;针对每一组访存请求,对一组访存请求中的所有访存请求进行轮询仲裁,选择出优先级最高的访存请求发送至对应的输出端口,其中,访存请求中编码的到达barrier的线程束数目越大,访存请求的优先级越高。本发明的用于GPU的NoC仲裁方法能够保证需要快速达到barrier的线程束发出的访存请求得到及时的响应,使得线程束快速通过barrier,加快线程束的执行速度,提高GPU的性能。