任务数目和性能感知的可重构多核处理器的资源分配方法

    公开(公告)号:CN104331331A

    公开(公告)日:2015-02-04

    申请号:CN201410610548.8

    申请日:2014-11-02

    IPC分类号: G06F9/50

    摘要: 一种任务数目和性能感知的可重构多核处理器的资源分配方法,动态可重构多核处理器具有运行时动态重构片上资源的能力,为降低任务平均周转时间,提高系统吞吐率和芯片资源利用率提供了巨大的优化空间。本发明中,在每个操作系统调度间隔内,资源分配器先根据任务的数目平均分配逻辑核,运行一定时钟周期后,根据任务的性能(反映任务对资源的需求)对其进行排序,找出对资源需求小的任务,减小所占用的逻辑核的粒度,并将从资源需求小的任务那里获得的空闲物理核分配给对资源需求高的任务,以增加该对资源需求高的任务占用的逻辑核的粒度。当系统当前的负载发生变化或者任务本身进入新的运行阶段时资源分配器将在下一次操作系统调度中及时做出调整以充分利用芯片资源。

    串行程序线程级推测执行能力评估方法和评估器

    公开(公告)号:CN102063289B

    公开(公告)日:2013-10-16

    申请号:CN201010278549.9

    申请日:2010-09-07

    IPC分类号: G06F9/38 G06F9/50

    摘要: 本申请公开了串行程序线程级推测执行能力评估方法和评估器,所述方法包括:通过记录串行程序一个执行阶段在执行过程中包括的正确推测的线程的数目,得到该执行阶段的线程推测深度值;确定所述线程推测深度值作为所述执行阶段后续重复执行时的线程级推测执行能力评估值;或者,将所述执行阶段及其前几个已执行阶段的线程级推测深度值的平均值作为所述执行阶段的下一个执行阶段的线程级推测执行能力评估值。该方案能够实现在串行程序的一个任务阶段执行之前,预先评估该任务阶段的线程级推测执行能力,使后续执行可以根据预估的推测执行能力,及时的为其分配处理器资源,以充分发挥串行程序的并行执行能力,提高多核平台上串行程序的执行效率。

    改进推测多线程的方法及装置

    公开(公告)号:CN102799414A

    公开(公告)日:2012-11-28

    申请号:CN201110136316.X

    申请日:2011-05-24

    IPC分类号: G06F9/38

    摘要: 本发明公开了一种改进推测多线程技术性能的方法及装置,其方法为:获取网络消息中的推测线程消息,区分并排列由先驱线程和后继线程发出的访存请求消息的优先级顺序,先驱线程发出的访存请求消息的优先级高于后继线程发出的访存请求消息;依据确定的优先级顺序向目录节点传送对应的访存请求消息,完成对目录节点处的数据读或写。通过上述本发明公开的方法,区分推测线程消息中的访存请求的优先级,以及对程序中的多个线程的区分优先级,以便于按照优先级的顺序完成对目录节点处的数据读或写,从而避免线程回退,降低线程中的回退率和TLS的功耗,稳定并提高TLS性能。

    病理图像交互式分割模型确定方法、应用方法及相关装置

    公开(公告)号:CN118762034A

    公开(公告)日:2024-10-11

    申请号:CN202410788464.7

    申请日:2024-06-18

    摘要: 本发明公开一种病理图像交互式分割模型确定方法、应用方法及相关装置,涉及图像分割技术领域,确定方法包括:获取病理图像数据集;对病理图像数据集进行预处理,得到若干个预处理后的图像;根据每一预处理后的图像,生成对应尺寸的空掩码和虚拟正、负点击编码图;将空掩码和虚拟正、负点击编码图与对应的预处理后的图像进行拼接,得到拼接后的图像;将拼接后的图像输入深度学习网络模型,得到预测输出;根据预测输出、拼接后的图像对应的分割掩码以及确定的损失函数,确定损失值;根据损失值对深度学习网络模型的网络参数进行优化,得到病理图像交互式分割模型。本发明能够在多种不同部位、不同分割目标的图像上得到良好的分割结果。

    一种面向异构融合系统的任务调度方法及装置

    公开(公告)号:CN111367644B

    公开(公告)日:2023-03-14

    申请号:CN202010187660.0

    申请日:2020-03-17

    IPC分类号: G06F9/48 G06F9/50

    摘要: 本发明公开了一种面向异构融合系统的任务调度方法,包括:在接收到调度请求时,获取与所述调度请求中各个任务对应的有向无环图,其中,所述有向无环图中的各个节点与所述各个任务对应;针对所述有向无环图中的每个节点,通过与其存在依赖关系的后继节点计算其对应的加权出度,得到各个加权出度;对所述各个加权出度进行排序,基于排序结果确定所述各个任务的优先级顺序;依据所述优先级顺序,分别在各个处理器中为每个任务选取目标处理器完成所述调度请求。上述的调度方法中,在确定每个任务优先级的过程只需要对有向无环图中与其存在依赖关系的后继节点进行计算,不需要遍历有向无环图中的全部节点进行计算,减少了计算量。

    消息传输方法及装置
    6.
    发明授权

    公开(公告)号:CN111752728B

    公开(公告)日:2022-09-06

    申请号:CN202010620904.X

    申请日:2020-06-30

    IPC分类号: G06F9/54

    摘要: 本发明提供了一种消息传输方法及装置,该方法包括:通过接收线程接收客户端发送的初始消息元组,并获取初始消息元组的任务号,基于该任务号确定目标执行器组,通过接收线程将初始消息元组传输至目标执行器组中,经过目标执行器组中包含的N个执行器依次对初始消息元组进行处理,由目标执行器组中的第N个执行器输出初始消息元组对应的目标消息元组,并将目标消息元组发送至发送线程的传输队列;通过发送线程将传输队列接收到的目标消息元组确定为待传输消息元组,并判断传输队列中存储的待传输消息元组是否满足预先设置的传输条件,若满足,则将传输队列中的待传输消息元组传输至服务端。能够节约处理器的资源,从而提升处理器的工作效率。

    任务调度系统及方法、存储介质及电子设备

    公开(公告)号:CN111708639A

    公开(公告)日:2020-09-25

    申请号:CN202010573441.6

    申请日:2020-06-22

    IPC分类号: G06F9/50

    摘要: 本发明提供了一种任务调度系统及方法、存储介质及电子设备,该系统包应用于图形处理器GPU,该系统包括:全局任务调度单元以及局部任务调度单元;全局任务调度单元,用于当检测到所述全局存储器存储的任务队列中存在目标子任务时,将目标子任务发送至当前任务量最少的流处理器的任务缓冲区;目标子任务为任务队列中无前向依赖的子任务;局部任务调度单元,用于将已发送至该任务缓冲区的目标子任务确定为待处理子任务,并按该任务缓存区中当前剩余的各个待处理子任务的处理优先级,依次将每个待处理子任务调度至该任务量最少的流处理器的执行内核,能够合理的为GPU的流处理器分配任务,提高GPU的运行性能。

    病灶识别方法及系统、识别设备
    8.
    发明公开

    公开(公告)号:CN111209916A

    公开(公告)日:2020-05-29

    申请号:CN201911424369.4

    申请日:2019-12-31

    摘要: 本发明提供了一种病灶识别方法及系统、识别设备,其中方法包括:获取同一病患的待识别图像和临床个性化数据;输入待识别图像和临床个性化数据至病灶识别模型,病灶识别模型对待识别图像进行分割操作和定性分析操作,获得待识别图像的定性分析结果以及用于指示病灶区域的输出图像;输出待识别图像的定性分析结果以及用于指示病灶区域的输出图像。本发明采用的病灶识别模型既可以分割病灶区域又能够进行定性分析操作,既可以避免人工勾画感兴趣区域的过程提高实用性,又可以减少预测过程中的工作量、提高定性分析过程的准确率。并且,在待识别图像基础上增加临床个性化数据,扩展输入特征的维度,可以进一步可以提高定性分析过程的准确率。

    一种应用于线程级推测并行的限制性值传递方法和装置

    公开(公告)号:CN102681890B

    公开(公告)日:2015-09-09

    申请号:CN201210133066.9

    申请日:2012-04-28

    IPC分类号: G06F9/46

    摘要: 本发明提出了一种应用于线程级推测并行的限制性值传递方法和装置,在冲突发生时可以通过值传递的方法来减少系统的总执行时间。也就是说只有在满足特定的条件,冲突线程才可能会受到需要的数据,否则就只会按原始系统的方式执行。这是一种轻量级的值传递方法,与彻底的值传递和值预测方法相比,具有硬件和协议复杂度低的优点,但是在一般情况下性能可能会不如彻底值传递和值预测。通过实验数据分析,与值预测模型相比,发现限制性值传递模型并没有太大的性能损失。本装置是在LogSPoTM模型上实现与验证的,但是它也适用于其他线程级系统。

    一种单指令多数据流结构上的数据处理方法及处理器

    公开(公告)号:CN101930358A

    公开(公告)日:2010-12-29

    申请号:CN201010261763.3

    申请日:2010-08-16

    IPC分类号: G06F9/38

    摘要: 本发明公开了一种SIMD上的数据处理方法及处理器,包括:选取符合条件的处理多组数据流,指令具有包括标记位和索引位的谓词域;将指令进行译码,并获取标记位和索引位的值;利用标记位的值判断指令是否为谓词指令;当指令为谓词指令时,读取预设谓词寄存器中与索引位值对应的表项内的谓词;将谓词均匀分配给多组数据流;分别比较标记位与每一组数据流对应的谓词的值;确定比较结果为相同的数据流为可处理数据流;执行指令处理可处理数据流。本发明公开的SIMD结构上的数据处理方法引入谓词执行方式,利用谓词标记和谓词的比较结果来判断是否需要执行指令处理数据流组,避免了处理不需要被处理的数据流造成的功耗浪费,以及处理效率低的问题。