在稀疏值映射到非零值的情况下针对深度学习的压缩

    公开(公告)号:CN109961392A

    公开(公告)日:2019-07-02

    申请号:CN201811398182.7

    申请日:2018-11-22

    申请人: 英特尔公司

    IPC分类号: G06T1/20 G06N3/08 G06N3/04

    摘要: 本文所描述的实施例提供了一种处理装置,所述处理装置包括计算逻辑,所述计算逻辑用于生成卷积神经网络(CNN)的神经网络数据并将所述神经网络数据写入存储器缓冲器。所述计算逻辑另外包括直接存储器存取(DMA)控制器,所述DMA控制器包括具有编码单元和解码单元的硬件编解码器,所述DMA控制器用于:从所述存储器缓冲器读取所述神经网络数据;经由所述编码单元对所述神经网络数据进行编码;将经编码神经网络数据写入与所述处理装置耦合的存储器设备中;将所述经编码神经网络数据的元数据写入与所述处理装置耦合的所述存储器设备;并且响应于来自所述计算逻辑的请求而经由所述解码单元对经编码神经网络数据进行解码。

    用于在机器学习环境下实现智能数据压缩的高效存储器布局

    公开(公告)号:CN109427033A

    公开(公告)日:2019-03-05

    申请号:CN201810803266.8

    申请日:2018-07-20

    申请人: 英特尔公司

    IPC分类号: G06T1/20 G06N3/08 G06N3/04

    摘要: 描述了一种用于促进高效存储器布局以用于在机器学习环境下实现智能数据压缩的机制。如本文所描述的,实施例的一种方法包括:促进将表示图像的初始图块划分成初级多个图块,从而使得所述初级多个图块中的每一个图块被视同为由计算装置的一个或多个处理器处理的独立图像。所述方法可以进一步包括:将所述初级多个图块计算成与本地缓冲器的大小兼容的次级多个图块。所述方法可以进一步包括:将所述多个次级多个图块合并成表示所述图像的最终图块;以及压缩所述最终图块。

    用于减少处理器中的等待时间的曲面细分重新分配

    公开(公告)号:CN115131193A

    公开(公告)日:2022-09-30

    申请号:CN202210127824.X

    申请日:2022-02-11

    申请人: 英特尔公司

    摘要: 公开了一种用于促进曲面细分重新分配以用于减少处理器中的等待时间的装置。装置包括:处理器,用于:为并行互连的几何固定功能单元提供单独的前端和后端,前端用于执行补片剔除和传输,并且后端用于执行来自前端的补片接收和补片曲面细分;提供曲面细分重新分配中央引擎,曲面细分重新分配中央引擎用于使用重新分配总线在后端之间重新分配补片;由曲面细分重新分配中央引擎从前端并行地接收被标记以供分配的补片传输,曲面细分重新分配引擎用于有序地处理补片传输;以及响应于从前端中的一个前端接收到同步屏障分组,由曲面细分重新分配中央引擎将同步屏障分组广播至后端,以使后端中的一个后端在本地处理曲面细分工作。