-
公开(公告)号:CN112534404A
公开(公告)日:2021-03-19
申请号:CN202080004209.9
申请日:2020-03-14
申请人: 英特尔公司
发明人: J·雷 , S·贾纳斯 , V·乔治 , S·马余兰 , A·考克 , A·阿普 , P·萨蒂 , V·兰甘塔纳 , V·安德烈 , A·加格 , Y·哈雷尔 , 小亚瑟·亨特 , S·金 , M·麦克弗森 , E·乌尔德-阿迈德-瓦尔 , W·萨德勒 , L·斯特里拉马萨尔玛 , V·维姆拉帕利
摘要: 本文中描述的实施例包括软件、固件、和硬件逻辑,这些软件、固件、和硬件逻辑提供用于经由脉动处理单元对稀疏数据执行算术的技术。本文中描述的实施例提供用于针对填充零的矩阵和子矩阵跳过计算操作的技术。实施例附加地提供用于维持数据压缩直到处理单元的技术。实施例附加地提供用于稀疏知晓逻辑单元的架构。
-
公开(公告)号:CN112905241A
公开(公告)日:2021-06-04
申请号:CN202110224132.2
申请日:2020-03-14
申请人: 英特尔公司
发明人: J·雷 , S·贾纳斯 , V·乔治 , S·马余兰 , A·考克 , A·阿普 , P·萨蒂 , V·兰甘塔纳 , V·安德烈 , A·加格 , Y·哈雷尔 , 小亚瑟·亨特 , S·金 , M·麦克弗森 , E·乌尔德-阿迈德-瓦尔 , W·萨德勒 , L·斯特里拉马萨尔玛 , V·维姆拉帕利
摘要: 本申请公开了用于矩阵加速器架构的稀疏优化。本文中描述的实施例包括软件、固件、和硬件逻辑,这些软件、固件、和硬件逻辑提供用于经由脉动处理单元对稀疏数据执行算术的技术。本文中描述的实施例提供用于针对填充零的矩阵和子矩阵跳过计算操作的技术。实施例附加地提供用于维持数据压缩直到处理单元的技术。实施例附加地提供用于稀疏知晓逻辑单元的架构。
-
公开(公告)号:CN112905241B
公开(公告)日:2024-03-29
申请号:CN202110224132.2
申请日:2020-03-14
申请人: 英特尔公司
发明人: J·雷 , S·贾纳斯 , V·乔治 , S·马余兰 , A·考克 , A·阿普 , P·萨蒂 , V·兰甘塔纳 , V·安德烈 , A·加格 , Y·哈雷尔 , 小亚瑟·亨特 , S·金 , M·麦克弗森 , E·乌尔德-阿迈德-瓦尔 , W·萨德勒 , L·斯特里拉马萨尔玛 , V·维姆拉帕利
摘要: 本申请公开了用于矩阵加速器架构的稀疏优化。本文中描述的实施例包括软件、固件、和硬件逻辑,这些软件、固件、和硬件逻辑提供用于经由脉动处理单元对稀疏数据执行算术的技术。本文中描述的实施例提供用于针对填充零的矩阵和子矩阵跳过计算操作的技术。实施例附加地提供用于维持数据压缩直到处理单元的技术。实施例附加地提供用于稀疏知晓逻辑单元的架构。
-
公开(公告)号:CN113454596A
公开(公告)日:2021-09-28
申请号:CN202080014238.3
申请日:2020-02-11
申请人: 英特尔公司
发明人: J·雷 , A·阿南塔拉曼 , A·R·阿普 , A·科克 , E·乌尔-艾哈迈德-瓦尔 , V·安德列 , S·麦于兰 , N·加洛普冯博里斯 , M·麦克费尔森 , B·阿什博 , M·拉曼多斯 , V·维穆拉帕利 , W·萨德勒 , J·皮尔斯 , S·金 , V·乔治
摘要: 涉及图形处理器中的标量核集成的方法和设备。在示例中,一种设备包括处理器,所述处理器用于:从主机集合体接收用于图形工作负荷的工作负荷指令集,确定操作集合中适合于由所述图形处理装置的标量处理器集合体执行的第一操作子集和操作集合中适合于由所述图形处理装置的向量处理器集合体执行的第二操作子集,将所述第一操作子集指派给所述标量处理器集合体以用于执行以生成第一输出集合,将所述第二操作子集指派给所述向量处理器集合体以用于执行以生成第二输出集合。还公开并要求保护其它实施例。
-
公开(公告)号:CN113424162A
公开(公告)日:2021-09-21
申请号:CN202080014341.8
申请日:2020-03-14
申请人: 英特尔公司
发明人: J·雷 , N·库雷 , S·迈于兰 , A·科克 , P·瑟蒂 , V·乔治 , V·安德烈 , A·阿普 , G·加西亚 , P·克 , S·金 , S·库马尔 , P·马罗利亚 , E·乌尔-艾哈迈德-瓦尔 , V·兰加纳坦 , W·萨德勒 , L·斯特里拉马萨马
IPC分类号: G06F12/0804 , G06F12/0893 , G06F12/0862 , G06F9/38 , G06F12/128
摘要: 本文描述的实施例提供了能够实现通用图形处理单元上的存储器的动态重新配置的技术。本文描述的一个实施例基于硬件统计能够实现高速缓冲存储器存储体指派的动态重新配置。一个实施例在相同页表层级内和相同页目录下使用混合四千字节和六十四千字节页能够实现虚拟存储器地址转化。一个实施例规定了一种图形处理器和相关联的异质处理系统,所述图形处理器和相关联的异质处理系统具有相同级别的缓存层级的近区域和远区域。
-
-
-
-