一种优化数据流架构数据传输延迟的方法及其系统

    公开(公告)号:CN107273098B

    公开(公告)日:2020-07-31

    申请号:CN201710304991.6

    申请日:2017-05-03

    IPC分类号: G06F9/38

    摘要: 本发明提供一种优化数据流架构数据传输延迟的方法及其系统,其中所述方法包括以下步骤:S1:记录上游节点和下游中每个指令槽对应的历史行为,并根据所述历史行为预测所述下游节点是否可以向所述上游节点提前发射空闲状态信息;S2:若所述下游节点可以向所述上游节点提前发射空闲状态信息,则将节点中的指令槽数据存储到预判发射部件中;所述指令槽数据中包含跳数延迟字段,用于表示上游节点的目标操作数到达下游节点的原操作数最快所需的跳数X;S3:根据所述跳数延迟字段,下游节点在X个周期之后向上游节点发送存储在所述预判发射部件中的指令槽数据。

    一种基于执行效率梯度预测的数据流图拥塞检测方法

    公开(公告)号:CN107506175B

    公开(公告)日:2020-07-28

    申请号:CN201710602370.6

    申请日:2017-07-21

    IPC分类号: G06F7/78

    摘要: 本发明公开了一种基于执行效率梯度预测的数据流图拥塞检测方法,该方法在数据流图中的每一节点分别设置计时器和指令计数器,在数据流图中设置一管理节点,在管理节点处设置第一信息记录表,第一信息记录表中记录有每一节点的ID、每一节点的执行速率v、执行速率变化率s、预测执行速率vn以及队列标志k,每一节点处均设置有第二信息记录表,每一节点进行拥塞检测的同时计算自身的执行速率v、执行速率变化率s以及预测执行速率vn,并将检测到的执行速率v、执行速率变化率s以及预测执行速率vn连同节点的ID以及队列标志k发送至管理节点,管理节点更新第一信息记录表并向该节点发送其附近节点的拥塞信息,该节点据此更新其对应的第二信息记录表。

    一种流式数据流图关键路径的加速方法、加速系统、装置及芯片

    公开(公告)号:CN106919368B

    公开(公告)日:2019-01-29

    申请号:CN201710028096.6

    申请日:2017-01-12

    IPC分类号: G06F9/38

    摘要: 本发明公开一种流式数据流图关键路径的加速方法、加速系统、装置及芯片,其中所述方法包括以下步骤:确定数据流中的关键节点;在所述关键节点之前增加前驱节点,在所述关键节点之后增加后继节点;复制关键节点形成多个关键子节点;待传输数据经过所述前驱节点后,选择其中一个可用的关键子节点,并经由选定的所述关键子节点从所述后继节点中输出所述待传输数据。本发明只对数据流图当中单个操作数存储空间进行优化,使得单个操作数存储空间当中的关键路径中的关键操作可以并行执行,从而缩短了数据流图中关键路径的执行时间,执行效率较传统结构有明显优势。

    芯片互联多应用有效映射方法、系统及内容寻址存储器

    公开(公告)号:CN108874729A

    公开(公告)日:2018-11-23

    申请号:CN201810353963.8

    申请日:2018-04-19

    IPC分类号: G06F15/78 G06F3/06 G11C15/04

    摘要: 本发明公开了一种芯片互联多应用有效映射的方法、系统及内容寻址存储器,其中所述的方法包括:在处理器单元中增加内容寻址存储器,并且在每一个数据分享指令中增加就绪标志位,只要就绪标志位被置位,该条数据的分享指令就可以被执行,当处理单元从内存或者其他的处理单元中获取数据之后,将存储该数据的存储器的索引作为输入传输到内容寻址存储器中,得到此数据分享指令的就绪标志位地址,将该数据分享指令的就绪位置位,该指令可发射执行,完成该数据的分享操作。该技术方案对芯片间数据分享的机制进行了优化,使芯片之间的数据可以灵活、高效的传输,传输效率和灵活性较传统的结构有明显优势。

    一种面向众核处理器的全局感知数据主动预取方法及系统

    公开(公告)号:CN107329813A

    公开(公告)日:2017-11-07

    申请号:CN201710433007.6

    申请日:2017-06-09

    IPC分类号: G06F9/48 G06F9/50 G06F12/0862

    摘要: 本发明公开了一种面向众核处理器的全局感知数据主动预取方法和系统,用于将一处理端需要的数据从一存储端预取出来并通过一传输端将预取出的数据传输至处理端,该方法在存储端设置有需求信息表,需求信息表中的每一信息条目分别记录有一线程的线程号num、该线程中正在执行的任务的优先级VPriority以及该线程中的任务在最近时间T内的访存频率Vmemory,该方法在存储端设置一渗透决策器,渗透决策器包括一忙闲感知单元、一决策计算单元以及一渗透执行单元,其中,忙闲感知单元实时侦测访存存储器端口及/或总线的忙闲端口的忙闲状态,决策计算单元用于根据每一任务的优先级VPriority、访存频率Vmemory以及预设的优先级权值m和访存频率权值n决定是否对任务进行数据渗透操作。

    一种多FPGA上电自动配置方法

    公开(公告)号:CN106919734A

    公开(公告)日:2017-07-04

    申请号:CN201710015609.X

    申请日:2017-01-10

    IPC分类号: G06F17/50

    CPC分类号: G06F17/5054

    摘要: 本发明公开了一种多FPGA上电自动配置方法,用于将多个配置文件分别写入多个FPGA芯片中,一个配置文件对应其中一个FPGA芯片,其包括以下步骤:S1:将多个配置文件分别写入多个存储模块中;S2:将每一FPGA芯片分别与一数据读写平台连接;S3:将每一数据平台与对应的存储模块连接;S4:每一数据读写平台分别从对应的存储模块中读取配置文件;S5:每一数据读写平台分别将读取到的配置文件写入对应的FPGA芯片中。本发明提供的多FPGA上电自动配置方法能够节省配置时间、节省人力及物力成本,并且能够解决各平台无法同步工作的问题。

    一种K近邻算法的加速装置及方法

    公开(公告)号:CN106355199A

    公开(公告)日:2017-01-25

    申请号:CN201610716367.2

    申请日:2016-08-24

    IPC分类号: G06K9/62

    CPC分类号: G06K9/6268

    摘要: 本发明提出一种K近邻算法的加速装置及方法,涉及信息检索、数据挖掘和计算机体系结构领域,该装置包括控制模块,用于控制所述加速装置中各模块;地址计算模块,用于获取训练样本的地址;欧氏距离计算模块,用于进行K近邻搜索时,计算距离;结果模块,用于储存所述距离,并将所述距离进行传送;排序模块,用于将所述距离进行K近邻排序。其中,所述结果模块将所述距离传送给所述排序模块,并向所述地址计算模块发送计算下一个地址的信号,所述地址计算模块接收所述信号并计算下一个训练样本的地址,所述控制模块将所述结果模块中的内容清空。本发明通过增减组件适应不同维度样本的KNN算法,对同样维度样本的计算通过调整并行度满足不同需求。

    一种面向众核处理器的全局感知数据主动预取方法及系统

    公开(公告)号:CN107329813B

    公开(公告)日:2020-08-04

    申请号:CN201710433007.6

    申请日:2017-06-09

    IPC分类号: G06F9/48 G06F9/50 G06F12/0862

    摘要: 本发明公开了一种面向众核处理器的全局感知数据主动预取方法和系统,用于将一处理端需要的数据从一存储端预取出来并通过一传输端将预取出的数据传输至处理端,该方法在存储端设置有需求信息表,需求信息表中的每一信息条目分别记录有一线程的线程号num、该线程中正在执行的任务的优先级VPriority以及该线程中的任务在最近时间T内的访存频率Vmemory,该方法在存储端设置一渗透决策器,渗透决策器包括一忙闲感知单元、一决策计算单元以及一渗透执行单元,其中,忙闲感知单元实时侦测访存存储器端口及/或总线的忙闲端口的忙闲状态,决策计算单元用于根据每一任务的优先级VPriority、访存频率Vmemory以及预设的优先级权值m和访存频率权值n决定是否对任务进行数据渗透操作。