使用低精度和高精度的混合推理

    公开(公告)号:CN110543332B

    公开(公告)日:2024-01-19

    申请号:CN201910973729.X

    申请日:2018-04-23

    申请人: 英特尔公司

    摘要: 本申请公开了使用低精度和高精度的混合推理。一个实施例提供了一种用于执行机器学习操作的计算设备,所述计算设备包括:指令解码逻辑,所述指令解码逻辑用于将包括多个操作数的单个指令解码成单个经解码指令,所述多个操作数具有不同的精度;以及包括第一逻辑单元和第二逻辑单元的通用图形计算单元,所述通用图形计算单元用于执行所述单个经解码指令,其中,执行所述单个经解码指令包括以第一精度对所述多个操作数中的第一组操作数执行第一指令操作,并且同时以第二精度对所述多个操作数中的第二组操作数执行第二指令操作。(56)对比文件胡玉贵.一种基于OPENACC指令加速的均值模糊算法《.软件导刊》.2013,(第01期),Stephen Junkins.The ComputeArchitecture of IntelR ProcessorGraphics Gen9《.Intel官网:"https://www.intel.com/content/dam/develop/external/us/en/documents/the-compute-architecture-of-intel-processor-graphics-gen9-v1d0.pdf》.2015,NVIDIA.NVIDIA"s Next Generation CUDACompute Architecture : Fermi《.道客巴巴网站》.2015,