-
公开(公告)号:CN107045493A
公开(公告)日:2017-08-15
申请号:CN201710025742.3
申请日:2017-01-13
申请人: 谷歌公司
发明人: 拉维·纳拉亚纳斯瓦米 , 拉胡尔·纳加拉扬 , 禹同爀 , 克里斯多佛·丹尼尔·利里
IPC分类号: G06F17/16
摘要: 本申请涉及矩阵处理装置。提供了方法、系统、和装置,其包括用于将稀疏元素变换为稠密矩阵的系统。所述系统被配置为:接收对于输出稠密矩阵的请求,所述输出稠密矩阵基于包括与第一稠密矩阵相关联的稀疏元素和与第二稠密矩阵相关联的稀疏元素的稀疏元素;获得由所述第一稀疏元素访问单元群组提取的与所述第一稠密矩阵相关联的稀疏元素;获得由所述第二稀疏元素访问单元群组提取的与所述第二稠密矩阵相关联的稀疏元素;以及对与所述第一稠密矩阵相关联的稀疏元素和与所述第二稠密矩阵相关联的稀疏元素进行变换以生成包括与所述第一稠密矩阵相关联的稀疏元素和与所述第二稠密矩阵相关联的稀疏元素的所述输出稠密矩阵。
-
公开(公告)号:CN108009626A
公开(公告)日:2018-05-08
申请号:CN201710908258.5
申请日:2017-09-29
申请人: 谷歌公司
发明人: 禹同爀 , 拉维·纳拉亚纳斯瓦米
IPC分类号: G06N3/04
CPC分类号: G06F13/1668 , G06F17/16 , G06N3/063 , G06N3/08 , G06N3/10 , G06N5/04 , G06N99/005
摘要: 本申请涉及利用神经网络计算单元中的输入数据稀疏。一种计算机实现的方法包括由计算设备接收输入激活并且由所述计算设备的控制器确定每个输入激活具有零值还是非零值。所述方法进一步包括在所述计算设备的存储器组中存储至少一个输入激活。存储至少一个输入激活包括生成索引,所述索引包括一个或多个存储器地址位置,该存储器地址位置具有非零值的输入激活值。所述方法仍进一步包括由控制器从存储器组提供至少一个输入激活到数据总线上,所述数据总线可由计算阵列的一个或多个单元来访问。激活至少部分从与索引相关联的存储器地址位置提供。
-
公开(公告)号:CN108009106A
公开(公告)日:2018-05-08
申请号:CN201710889996.X
申请日:2017-09-27
申请人: 谷歌公司
发明人: 奥利维尔·泰马姆 , 拉维·纳拉亚纳斯瓦米 , 哈西特·哈伊坦 , 禹同爀
CPC分类号: G06F9/3001 , G06F9/30065 , G06F13/28 , G06N3/04 , G06N3/0454 , G06N3/063
摘要: 本申请涉及神经网络计算模组。公开了一种计算单元,所述计算单元包括用于存储输入激活的第一存储器群和用于存储在执行计算中所使用的参数的第二存储器群。所述计算单元包括至少一个cell,所述至少一个cell包括从所述第二存储器群接收参数并执行计算的至少一个乘法累加(“MAC”)运算器.所述计算单元进一步包括第一遍历单元,所述第一遍历单元向所述第一存储器群提供控制信号以使输入激活被提供至能够由所述MAC运算器访问的数据总线。所述计算单元执行与数据阵列中的至少一个元素相关联的一个或者多个计算,所述一个或多个计算由所述MAC运算器执行并且部分地包括从所述数据总线接收的所述输入激活与从所述第二存储器群接收的参数的乘法运算。
-
公开(公告)号:CN108009627A
公开(公告)日:2018-05-08
申请号:CN201710909908.8
申请日:2017-09-29
申请人: 谷歌公司
发明人: 拉维·纳拉亚纳斯瓦米 , 禹同爀 , 奥利维尔·泰马姆 , 哈西特·哈伊坦
CPC分类号: G06N3/04 , G06F13/28 , G06N3/0454 , G06N3/063
摘要: 本申请涉及一种神经网络指令集架构。一种计算机实现方法包括由处理单元接收指定用于施行张量计算的数据值的指令。响应于接收到指令,所述方法可以包括通过执行包括多个循环的循环嵌套,由处理单元施行张量计算,其中循环嵌套的结构基于指令的数据值中的一个或多个来定义。张量计算能够至少是神经网络层的计算的部分。由指令指定的数据值能够至少包括指定神经网络层的类型的值,并且循环嵌套的结构可以至少部分地通过神经网络层的类型来定义。
-
公开(公告)号:CN107045492A
公开(公告)日:2017-08-15
申请号:CN201710025656.2
申请日:2017-01-13
申请人: 谷歌公司
发明人: 拉维·纳拉亚纳斯瓦米 , 拉胡尔·纳加拉扬 , 禹同爀 , 克里斯多佛·丹尼尔·利里
IPC分类号: G06F17/16
CPC分类号: G06F17/16 , G06F9/3887 , G06F17/14 , H03M7/30
摘要: 本申请涉及矩阵处理装置。提供了方法、系统、和装置,其包括用于将稀疏元素变换为稠密矩阵的系统。所述系统包括数据提取单元,其包括多个处理器,所述数据提取单元被配置为基于对特定稀疏元素的子集的识别,确定用于提取所述特定稀疏元素的所述子集的处理器指定。所述系统包括串接单元,所述串接单元被配置为基于被应用于由所述数据提取单元提取的稀疏元素的变换来生成输出稠密矩阵。
-
-
-
-