用于机器学习的硬件实现的点对点通信原语

    公开(公告)号:CN108805795B

    公开(公告)日:2024-11-08

    申请号:CN201810419238.6

    申请日:2018-05-04

    申请人: 英特尔公司

    IPC分类号: G06T1/40

    摘要: 一个实施例提供用于计算并分发数据以用于神经网络的分布式训练的系统,该系统包括:第一存储器,其存储包括机器学习框架的第一组指令;结构接口,其实现与该组可训练机器学习参数相关联的数据的传输和接收;第一组通用处理器核心,其执行第一组指令,该第一组指令提供训练工作流以用于针对可训练机器学习参数的梯度的计算并与第二组指令通信,该第二组指令有利于经由结构接口来传输和接收梯度;以及图形处理器,其执行与训练工作流相关联的计算操作以生成针对可训练机器学习参数的梯度。

    一种面向GPU的高效隐私保护机器学习方法及系统

    公开(公告)号:CN118860489A

    公开(公告)日:2024-10-29

    申请号:CN202410819094.9

    申请日:2024-06-24

    申请人: 山东大学

    摘要: 本发明提出了一种面向GPU的高效隐私保护机器学习方法及系统,涉及隐私保护机器学习领域,包括:秘密共享模块,被配置为:通过秘密共享的方式,将待处理的数据集进行秘密分片并分发给各个参与方;隐私推理模块,被配置为:各个参与方利用本地隐私训练后的隐私保护神经网络,对分发的数据集分片进行隐私推理,得到分片推理结果;秘密恢复模块,被配置为:基于各个参与方的分片推理结果,通过秘密恢复的方式,得到明文的推理结果;本发明采用分层架构构建隐私保护神经网络,将基于整数环的整数运算映射到GPU浮点数运算上,实现对高位长整数密态张量的加速计算,从而得到面向GPU的高效隐私保护机器学习方案,提高计算准确性,减小额外引入的计算开销。

    光检测装置及电子装置
    3.
    发明公开

    公开(公告)号:CN118830257A

    公开(公告)日:2024-10-22

    申请号:CN202380024796.1

    申请日:2023-02-20

    发明人: 宝玉晋

    摘要: 本公开涉及使得可以提高效率的光检测装置和电子装置。在本公开中,组接口设置在图像传感器与处理器之间,在图像传感器中,设置的像素组由以阵列形状布置在传感器表面上的多个像素中的N个像素组成;并且在处理器中,从具有M个神经元的神经元组来配置神经网络。通过该组接口,在图像传感器与处理器之间执行双向通信。例如,本技术可应用于堆叠型CMOS图像传感器。

    基于跨域交互的全天时场景自监督深度估计方法及系统

    公开(公告)号:CN118134981B

    公开(公告)日:2024-10-22

    申请号:CN202410557541.8

    申请日:2024-05-08

    申请人: 山东大学

    IPC分类号: G06F30/27 G06T1/40 G06N3/09

    摘要: 本公开提出基于跨域交互的全天时场景自监督深度估计方法及系统,涉及深度估计技术领域。方法包括:将待估计全天时图像输入至深度估计模型,得到深度估计结果;其中,深度估计模型中,跨域交互模块用于将全天时图像样本解耦为日间私有特征和共享特征,夜间私有特征和共享特征;利用正交损失约束两个私有特征的互补性,基于共享特征交换私有特征重建图像;跨域耦合投影模块用于将两个共享特征分别解码为深度图,基于全天时图像样本、深度图、位姿矩阵,采用场景损失监督训练,得到自监督单目深度估计结果。充分考虑昼夜图像中包含的共享信息,并深化夜间图像的纹理信息,提高了深度估计模型对全天时场景进行深度估计的适应能力及结果准确性。

    特征图缓存装置、方法、设备及存储介质

    公开(公告)号:CN118799168A

    公开(公告)日:2024-10-18

    申请号:CN202411287574.1

    申请日:2024-09-14

    发明人: 买廷瑞

    摘要: 本申请涉及芯片技术领域,提供了一种特征图缓存装置、方法、设备及存储介质,装置包括:缓存模块包括多个存储区域;每个存储区域包括s个子存储区域;第t个子存储区域包括多个存储列以及多个存储行;第q个存储区域用于存储特征图的第q行像素点的数据;第一存储地址对应的存储块用于存储对应的像素点的数据;写模块获取像素点的数据,基于预设配置参数生成第一存储地址;基于第一存储地址,将像素点的数据写入缓存模块;读模块基于预设配置参数生成第k组读地址;从缓存模块中读取第k组读地址对应的n个像素点的数据;卷积核中第g行数值与第q行像素点的数据进行计算。本申请的技术方案,提高了输入数据的复用率,减小了硬件面积和功耗。

    一种基于机器视觉的割草机器人的调度方法

    公开(公告)号:CN110447372B

    公开(公告)日:2024-07-23

    申请号:CN201910816762.1

    申请日:2019-08-30

    IPC分类号: G06T1/40

    摘要: 本发明公开了一种基于机器视觉的割草机器人的调度方法,步骤:一、通过摄像机获取周围环境照片;二、将获取的周围环境照片输入青草识别模型即训练后的SSD算法模型得该照片的青草信息;三、判断照片中是否有青草,如无青草则旋转摄像机后返回步骤一,反之则以该照片中青草的任一坐标为目标点I,驱动割草机器人向目标点I运动,割草机器人到达目标点I后开启割草电机;四、割草完成后判断该照片的青草的所有坐标是否均已成为目标点,如是则旋转摄像机后返回步骤一,如摄像机旋转180°后仍未发现青草则割草工作结束,反之返回步骤三。本发明的调度方法,控制过程流程简单,逻辑简单且有效,能够有效调度割草机器人完成割草工作,应用前景好。

    神经渲染的多核加速
    9.
    发明公开

    公开(公告)号:CN118140243A

    公开(公告)日:2024-06-04

    申请号:CN202180103457.3

    申请日:2021-12-09

    IPC分类号: G06T1/40 G06F15/16

    摘要: 本发明描述了一种用于渲染图像的计算核。计算核包括位置编码逻辑和在流水线中串联连接的多个流水线逻辑。位置编码逻辑被配置为将与图像的一部分相对应的采样点的坐标和方向变换为高维表示。多个流水线逻辑被配置为基于坐标的高维表示和方向的高维表示在一个流水线循环中输出与图像的该部分相对应的像素的强度值及颜色值。多个流水线逻辑被配置为并行运行。本文描述了一种计算机实现的方法。计算系统被配置为将待渲染图像划分成多行图像部分。计算系统针对每个图像部分获得与图像部分的像素相对应的采样点的坐标和方向。计算系统针对每个图像部分将坐标和方向变换为高维表示。计算系统通过计算核来确定像素的强度值和颜色值。计算系统基于多行图像部分的像素的强度值和颜色值来重建图像。

    CMOS像素内感算一体化电路系统及一体运算方法

    公开(公告)号:CN118118812A

    公开(公告)日:2024-05-31

    申请号:CN202410163205.5

    申请日:2024-02-05

    摘要: 本发明提供了一种CMOS像素内感算一体化电路系统及一体运算方法,包括多个像素电路单元组成的用于实现光电流卷积计算的像素阵列模块、用于提供权重电压值的权重电压产生模块、用于输出传感模式行选信号和卷积模式行选信号的行选信号电路控制模块以及用于输出像素阵列模块电流/电压值的读出信号电路模块。像素阵列模块,包括多个像素电路单元,每一个像素电路单元均包括用于将光电流信号转化为电压信号的光电流转化模块和用于对与光电流线性相关的电压信号与权重电压值相乘进而完成光电流的卷积计算权重运算模块。本发明减少了权重加载的次数,减轻外围电路的负担,提高了卷积计算的并行度,加快了运算速度。