使用低精度和高精度的混合推理

    公开(公告)号:CN110543332B

    公开(公告)日:2024-01-19

    申请号:CN201910973729.X

    申请日:2018-04-23

    申请人: 英特尔公司

    摘要: 本申请公开了使用低精度和高精度的混合推理。一个实施例提供了一种用于执行机器学习操作的计算设备,所述计算设备包括:指令解码逻辑,所述指令解码逻辑用于将包括多个操作数的单个指令解码成单个经解码指令,所述多个操作数具有不同的精度;以及包括第一逻辑单元和第二逻辑单元的通用图形计算单元,所述通用图形计算单元用于执行所述单个经解码指令,其中,执行所述单个经解码指令包括以第一精度对所述多个操作数中的第一组操作数执行第一指令操作,并且同时以第二精度对所述多个操作数中的第二组操作数执行第二指令操作。(56)对比文件胡玉贵.一种基于OPENACC指令加速的均值模糊算法《.软件导刊》.2013,(第01期),Stephen Junkins.The ComputeArchitecture of IntelR ProcessorGraphics Gen9《.Intel官网:"https://www.intel.com/content/dam/develop/external/us/en/documents/the-compute-architecture-of-intel-processor-graphics-gen9-v1d0.pdf》.2015,NVIDIA.NVIDIA"s Next Generation CUDACompute Architecture : Fermi《.道客巴巴网站》.2015,

    自主机器的通用输入/输出数据捕获和神经高速缓存系统

    公开(公告)号:CN109690578B

    公开(公告)日:2024-01-02

    申请号:CN201680088988.9

    申请日:2016-10-05

    申请人: 英特尔公司

    发明人: 马立伟 宋继强

    摘要: 描述了一种用于促进自主机器的通用输入/输出数据捕获和神经高速缓存系统的机制。如本文所描述的,实施例的方法包括由图像捕获装置捕获一个或多个对象的一个或多个图像,其中,所述一个或多个图像表示与神经网络相关联的输入数据。所述方法可以进一步包括通过将由默认神经高速缓存系统生成的第一输出结果与由自定义神经高速缓存系统预测的第二输出结果进行比较来确定所述第一输出结果的准确性。所述方法可以进一步包括基于所述准确性来输出包括所述第一输出结果或所述第二输出结果中的至少一者的最终输出结果。