用于可扩展的可远程访问存储器片段的技术

    公开(公告)号:CN107533536B

    公开(公告)日:2021-11-23

    申请号:CN201680018854.X

    申请日:2016-02-29

    申请人: 英特尔公司

    IPC分类号: G06F15/173 G06F3/06

    摘要: 用于单边远程存储器访问通信的技术包括在网络上进行通信时的多个计算节点。接收方计算节点接收来自发送方节点的消息并从所述消息中提取片段标识符。所述接收方计算节点基于所述片段标识符确定与其本地存储器的分区全局地址空间(PGAS)片段相关联的片段起始地址。所述接收方计算节点可以对所述本地存储器中或主机结构接口中所存储的片段表进行索引。所述接收方计算节点基于所述消息中所包括的所述片段起始地址和偏移量确定所述PGAS片段内的本地目的地地址。所述接收方计算节点在所述本地目的地地址处执行远程存储器访问操作。所述接收方计算节点可以通过所述接收方计算节点的所述主机结构接口在硬件中执行这些操作。描述并要求保护了其他实施例。

    用于改善高性能计算应用的性能数据收集的方法与设备

    公开(公告)号:CN111611125A

    公开(公告)日:2020-09-01

    申请号:CN202010084130.3

    申请日:2020-02-10

    申请人: 英特尔公司

    IPC分类号: G06F11/30

    摘要: 公开了用于改善性能数据收集的方法、设备、系统和制品。示例设备包括:源节点的性能数据比较器,用于以轮询频率从主机结构接口收集源节点的应用的性能数据;接口,用于将写回指令传送至主机结构接口,写回指令用于使得数据被写入源节点的存储器的存储器地址位置以触发唤醒模式;和频率选择器,该频率选择器用于:将轮询频率启动为针对睡眠模式的第一轮询频率;并且响应于存储器地址位置中的、标识唤醒模式的数据将轮询频率增加到第二轮询频率。

    用于可扩展的可远程访问存储器片段的技术

    公开(公告)号:CN107533536A

    公开(公告)日:2018-01-02

    申请号:CN201680018854.X

    申请日:2016-02-29

    申请人: 英特尔公司

    IPC分类号: G06F15/173 G06F3/06

    摘要: 用于单边远程存储器访问通信的技术包括在网络上进行通信时的多个计算节点。接收方计算节点接收来自发送方节点的消息并从所述消息中提取片段标识符。所述接收方计算节点基于所述片段标识符确定与其本地存储器的分区全局地址空间(PGAS)片段相关联的片段起始地址。所述接收方计算节点可以对所述本地存储器中或主机结构接口中所存储的片段表进行索引。所述接收方计算节点基于所述消息中所包括的所述片段起始地址和偏移量确定所述PGAS片段内的本地目的地地址。所述接收方计算节点在所述本地目的地地址处执行远程存储器访问操作。所述接收方计算节点可以通过所述接收方计算节点的所述主机结构接口在硬件中执行这些操作。描述并要求保护了其他实施例。

    用于对存储器缓冲区存取进行细粒度完成跟踪的技术

    公开(公告)号:CN108628764B

    公开(公告)日:2023-05-23

    申请号:CN201810148369.5

    申请日:2018-02-13

    申请人: 英特尔公司

    摘要: 用于对存储器缓冲区存取进行细粒度完成跟踪的技术包括计算设备。该计算设备用于建立针对存储器缓冲区的多个计数器对。每个计数器对包括本地管理的偏移量和完成计数器。该计算设备还用于:接收来自远程计算设备的对存储器缓冲区进行存取的请求,将计数器对中的一个计数器对分配给该请求,使所分配的计数器对的本地管理的偏移量前进待读取或写入的数据的量,以及在数据被从存储器缓冲区读取或被写入存储器缓冲区时使所分配的计数器对的完成计数器前进。还描述并要求保护其它实施例。

    用于聚合消息处理的计算节点、方法、设备和可读介质

    公开(公告)号:CN107925593B

    公开(公告)日:2021-12-07

    申请号:CN201680048798.4

    申请日:2016-08-23

    申请人: 英特尔公司

    IPC分类号: H04L12/26 H04L12/863

    摘要: 用于基于聚合的消息处理的技术包括多个计算节点通过网络进行通信。计算节点从远程计算节点接收消息,响应于接收消息而使事件计数器递增,响应于使计数器递增来确定事件触发器是否被满足,并且如果事件触发器被满足而将完成事件写入到事件队列。计算节点的应用针对完成事件来监视事件队列。该应用可以由计算节点的处理器核心执行,并且其他操作可以由计算节点的主机结构接口来执行。计算节点可以是目标节点并且对从发起者节点接收到的单端消息进行计数,或者计算节点可以是发起者节点并且对从目标节点接收的确认消息进行计数。描述和要求保护其他实施例。

    用于集成的线程调度的技术

    公开(公告)号:CN107924330A

    公开(公告)日:2018-04-17

    申请号:CN201680048794.6

    申请日:2016-09-20

    申请人: 英特尔公司

    IPC分类号: G06F9/48

    摘要: 用于集成的线程调度的技术包括具有网络接口控制器(NIC)的计算设备。NIC被配置为检测和挂起正被一个或多个通信操作阻塞的线程。NIC的线程调度引擎被配置为将挂起的线程从系统线程调度器的运行队列移动到线程调度引擎的未决队列。线程调度引擎还被配置为在确定任何依赖和/或阻塞通信操作已经完成时,将挂起的线程从未决队列移动到线程调度引擎的就绪队列。描述和要求保护其他实施例。

    用于提供结构集成的数据拉取引擎的系统和方法

    公开(公告)号:CN108292287B

    公开(公告)日:2021-11-05

    申请号:CN201680068889.4

    申请日:2016-11-26

    申请人: 英特尔公司

    IPC分类号: G06F13/40

    摘要: 在示例中,公开了一种计算节点,其包括:第一一个或多个逻辑元件,其包括用于产生数据单元的数据生产者引擎;以及主机结构接口,其用于将计算节点通信地耦合到结构,主机结构接口包括第二一个或多个逻辑元件,该第二一个或多个逻辑元件包括数据拉取引擎,该数据拉取引擎用于:将数据单元公布为可用;接收针对数据单元的拉取请求,拉取请求包括数据消费者的节点标识符;以及经由结构向数据消费者发送数据单元。还公开了一种提供数据拉取引擎的方法。

    用于动态工作队列管理的技术
    10.
    发明公开

    公开(公告)号:CN108701056A

    公开(公告)日:2018-10-23

    申请号:CN201780014424.5

    申请日:2017-03-01

    申请人: 英特尔公司

    IPC分类号: G06F9/48 G06F9/38

    CPC分类号: H04L67/1008

    摘要: 用于动态工作队列管理的技术包括通信地耦合到消费者计算设备的生产者计算设备。消费者计算设备被配置为发送弹出请求(例如,单侧拉取请求),其包括指示从生产者计算设备中拉取的工作量的消费约束(例如,从生产者的工作队列返回的工作元素的可接受分数的范围)。生产者计算设备被配置为确定是否可以满足弹出请求并生成响应,该响应包括确定结果的指示以及一个或者多个生产者度量,所述生产者度量可以由消费者计算设备用于确定消费者计算设备在接收到响应消息时要执行的后续动作。本文描述并要求保护其他实施例。