-
公开(公告)号:CN108805795B
公开(公告)日:2024-11-08
申请号:CN201810419238.6
申请日:2018-05-04
申请人: 英特尔公司
IPC分类号: G06T1/40
摘要: 一个实施例提供用于计算并分发数据以用于神经网络的分布式训练的系统,该系统包括:第一存储器,其存储包括机器学习框架的第一组指令;结构接口,其实现与该组可训练机器学习参数相关联的数据的传输和接收;第一组通用处理器核心,其执行第一组指令,该第一组指令提供训练工作流以用于针对可训练机器学习参数的梯度的计算并与第二组指令通信,该第二组指令有利于经由结构接口来传输和接收梯度;以及图形处理器,其执行与训练工作流相关联的计算操作以生成针对可训练机器学习参数的梯度。
-
公开(公告)号:CN118860489A
公开(公告)日:2024-10-29
申请号:CN202410819094.9
申请日:2024-06-24
申请人: 山东大学
IPC分类号: G06F9/30 , G06T1/40 , G06F21/62 , G06N3/0499 , G06N3/048
摘要: 本发明提出了一种面向GPU的高效隐私保护机器学习方法及系统,涉及隐私保护机器学习领域,包括:秘密共享模块,被配置为:通过秘密共享的方式,将待处理的数据集进行秘密分片并分发给各个参与方;隐私推理模块,被配置为:各个参与方利用本地隐私训练后的隐私保护神经网络,对分发的数据集分片进行隐私推理,得到分片推理结果;秘密恢复模块,被配置为:基于各个参与方的分片推理结果,通过秘密恢复的方式,得到明文的推理结果;本发明采用分层架构构建隐私保护神经网络,将基于整数环的整数运算映射到GPU浮点数运算上,实现对高位长整数密态张量的加速计算,从而得到面向GPU的高效隐私保护机器学习方案,提高计算准确性,减小额外引入的计算开销。
-
公开(公告)号:CN118830257A
公开(公告)日:2024-10-22
申请号:CN202380024796.1
申请日:2023-02-20
申请人: 索尼半导体解决方案公司
发明人: 宝玉晋
IPC分类号: H04N25/76 , G06N3/049 , G06T1/40 , H01L27/146 , G06N3/067
摘要: 本公开涉及使得可以提高效率的光检测装置和电子装置。在本公开中,组接口设置在图像传感器与处理器之间,在图像传感器中,设置的像素组由以阵列形状布置在传感器表面上的多个像素中的N个像素组成;并且在处理器中,从具有M个神经元的神经元组来配置神经网络。通过该组接口,在图像传感器与处理器之间执行双向通信。例如,本技术可应用于堆叠型CMOS图像传感器。
-
公开(公告)号:CN118134981B
公开(公告)日:2024-10-22
申请号:CN202410557541.8
申请日:2024-05-08
申请人: 山东大学
摘要: 本公开提出基于跨域交互的全天时场景自监督深度估计方法及系统,涉及深度估计技术领域。方法包括:将待估计全天时图像输入至深度估计模型,得到深度估计结果;其中,深度估计模型中,跨域交互模块用于将全天时图像样本解耦为日间私有特征和共享特征,夜间私有特征和共享特征;利用正交损失约束两个私有特征的互补性,基于共享特征交换私有特征重建图像;跨域耦合投影模块用于将两个共享特征分别解码为深度图,基于全天时图像样本、深度图、位姿矩阵,采用场景损失监督训练,得到自监督单目深度估计结果。充分考虑昼夜图像中包含的共享信息,并深化夜间图像的纹理信息,提高了深度估计模型对全天时场景进行深度估计的适应能力及结果准确性。
-
公开(公告)号:CN118799168A
公开(公告)日:2024-10-18
申请号:CN202411287574.1
申请日:2024-09-14
申请人: 爱芯元智半导体股份有限公司
发明人: 买廷瑞
IPC分类号: G06T1/60 , G06T1/40 , G06N3/0464 , G06N3/063 , G06N3/08
摘要: 本申请涉及芯片技术领域,提供了一种特征图缓存装置、方法、设备及存储介质,装置包括:缓存模块包括多个存储区域;每个存储区域包括s个子存储区域;第t个子存储区域包括多个存储列以及多个存储行;第q个存储区域用于存储特征图的第q行像素点的数据;第一存储地址对应的存储块用于存储对应的像素点的数据;写模块获取像素点的数据,基于预设配置参数生成第一存储地址;基于第一存储地址,将像素点的数据写入缓存模块;读模块基于预设配置参数生成第k组读地址;从缓存模块中读取第k组读地址对应的n个像素点的数据;卷积核中第g行数值与第q行像素点的数据进行计算。本申请的技术方案,提高了输入数据的复用率,减小了硬件面积和功耗。
-
公开(公告)号:CN118505486A
公开(公告)日:2024-08-16
申请号:CN202410579428.X
申请日:2024-05-10
申请人: 上海壁仞科技股份有限公司
摘要: 本发明实施例提供了均值算子的执行方法、芯片、设备、介质以及程序产品,用以提高均值算子的执行效率。该方法包括:N个执行单元并行执行第一操作;一个执行单元执行的第一操作包括:从显存中加载输入图像中的多个待处理数据,对多个待处理数据执行第一运算,并将第一运算结果写入片上高速缓存,第一运算结果与N个执行单元中的其他N‑1个执行单元写入片上高速缓存中的第一运算的执行结果进行累加,得到第一累加结果;N个执行单元中的参考执行单元根据从片上高速缓存中加载第一累加结果,根据第一累加结果确定第一均值结果,并将第一均值结果写出到显存,从而可以有效发挥芯片的并行计算能力,提升均值算子的执行效率。
-
公开(公告)号:CN113837921B
公开(公告)日:2024-08-06
申请号:CN202111131270.2
申请日:2021-09-26
申请人: 安徽寒武纪信息科技有限公司
IPC分类号: G06T1/40 , G06N3/08 , G06N3/063 , G06N3/0464
摘要: 本披露公开了一种数据处理装置、利用数据处理装置执行分块指令的数据处理方法及相关产品。该数据处理装置可以作为计算装置包括在组合处理装置中,该组合处理装置还可以包括接口装置和其他处理装置。该计算装置与其他处理装置进行交互,共同完成用户指定的计算操作。组合处理装置还可以包括存储装置,该存储装置分别与计算装置和其他处理装置连接,用于存储该计算装置和其他处理装置的数据。本披露的方案实现了小卷积运算中的数据维度转换存储,提高了运算处理效率。
-
公开(公告)号:CN110447372B
公开(公告)日:2024-07-23
申请号:CN201910816762.1
申请日:2019-08-30
申请人: 上海工程技术大学
IPC分类号: G06T1/40
摘要: 本发明公开了一种基于机器视觉的割草机器人的调度方法,步骤:一、通过摄像机获取周围环境照片;二、将获取的周围环境照片输入青草识别模型即训练后的SSD算法模型得该照片的青草信息;三、判断照片中是否有青草,如无青草则旋转摄像机后返回步骤一,反之则以该照片中青草的任一坐标为目标点I,驱动割草机器人向目标点I运动,割草机器人到达目标点I后开启割草电机;四、割草完成后判断该照片的青草的所有坐标是否均已成为目标点,如是则旋转摄像机后返回步骤一,如摄像机旋转180°后仍未发现青草则割草工作结束,反之返回步骤三。本发明的调度方法,控制过程流程简单,逻辑简单且有效,能够有效调度割草机器人完成割草工作,应用前景好。
-
公开(公告)号:CN118140243A
公开(公告)日:2024-06-04
申请号:CN202180103457.3
申请日:2021-12-09
申请人: 上海科技大学
摘要: 本发明描述了一种用于渲染图像的计算核。计算核包括位置编码逻辑和在流水线中串联连接的多个流水线逻辑。位置编码逻辑被配置为将与图像的一部分相对应的采样点的坐标和方向变换为高维表示。多个流水线逻辑被配置为基于坐标的高维表示和方向的高维表示在一个流水线循环中输出与图像的该部分相对应的像素的强度值及颜色值。多个流水线逻辑被配置为并行运行。本文描述了一种计算机实现的方法。计算系统被配置为将待渲染图像划分成多行图像部分。计算系统针对每个图像部分获得与图像部分的像素相对应的采样点的坐标和方向。计算系统针对每个图像部分将坐标和方向变换为高维表示。计算系统通过计算核来确定像素的强度值和颜色值。计算系统基于多行图像部分的像素的强度值和颜色值来重建图像。
-
公开(公告)号:CN118118812A
公开(公告)日:2024-05-31
申请号:CN202410163205.5
申请日:2024-02-05
申请人: 上海交通大学
摘要: 本发明提供了一种CMOS像素内感算一体化电路系统及一体运算方法,包括多个像素电路单元组成的用于实现光电流卷积计算的像素阵列模块、用于提供权重电压值的权重电压产生模块、用于输出传感模式行选信号和卷积模式行选信号的行选信号电路控制模块以及用于输出像素阵列模块电流/电压值的读出信号电路模块。像素阵列模块,包括多个像素电路单元,每一个像素电路单元均包括用于将光电流信号转化为电压信号的光电流转化模块和用于对与光电流线性相关的电压信号与权重电压值相乘进而完成光电流的卷积计算权重运算模块。本发明减少了权重加载的次数,减轻外围电路的负担,提高了卷积计算的并行度,加快了运算速度。
-
-
-
-
-
-
-
-
-